Jundong Xu
싱가포르국립대학교(NUS) 컴퓨팅학부 박사과정(2025-2029). 지도교수는 Mong-Li Lee, Wynne Hsu. GitHub 핸들은 Aiden0526.
대표 연구는 두 방향이다. 첫째, LogicReward(ICLR 2026) -- LLM 추론의 각 스텝을 기호적으로 감독해 단계별 보상을 제공하는 강화학습 프레임워크다. LLaMA-3.1-8B 기준 8개 논리 추론 벤치마크에서 평균 +11%, Qwen-3-8B에서 +3.2%를 달성했다. 둘째, EvoArena(2026) -- 환경이 지속적으로 변화하는 상황에서 LLM 에이전트를 평가하는 벤치마크 스위트로, Qingchuan Li와 공동 1저자다.
EvoArena 논문에서는 동적 환경 벤치마크 설계와 Terminal-Bench-Evo 구축을 주도했다. 지도교수인 Bryan Hooi, Zhiyuan Hu와 함께 NUS 측 핵심 기여자로 참여했다.