후즈위안

개요

후즈위안(Zhiyuan Hu)은 싱가포르국립대학교(NUS) 데이터과학·컴퓨팅학부 박사과정(2023-2026) 연구자로, MIT에서 방문 박사 연구원으로도 활동하고 있습니다. LLM 기반 에이전트의 사회적·대화적 능력, 추론·보정 능력, 다중 에이전트 협업 등을 연구하며, 현재 학계와 산업계 모두에서 포지션을 모색하고 있습니다.

지도교수는 NUS의 브라이언 후이(Bryan Hooi), See-Kiong Ng, Anh Tuan Luu(NTU)이며, MIT에서는 신시아 브레이질(Cynthia Breazeal)과 Hae Won Park과 함께 작업합니다. 다중 LLM 에이전트의 인지·적응성·합리성·협업을 체계적으로 조사한 MAgIC 벤치마크로 널리 알려져 있습니다.

2025~2026년에는 ICLR 2026에서 두 편의 논문이 채택되었고, ACL 2025에서 한 편이 발표되는 등 활발한 연구 활동을 이어가고 있습니다. 2025년 11월에는 Thinking Machine Research Grant를 수상하고 DAAD AInet Fellowship에 선정되기도 했습니다.

생애

후즈위안은 컴퓨터과학 분야 학부·석사 교육을 마친 뒤 2023년 싱가포르국립대학교 데이터과학·컴퓨팅 대학원에 박사과정으로 진학했습니다. NUS IDS(Institute of Data Science)와 SoC(School of Computing) 소속으로, 다수의 지도교수로부터 다양한 관점의 지도를 받는 구조로 연구를 진행하고 있습니다.

박사 과정 중 MIT 미디어랩 방문 연구원 자격을 얻어 신시아 브레이질 교수팀과 협력하게 되었습니다. MIT 미디어랩은 인간-컴퓨터 상호작용과 사회적 로봇공학으로 유명한 연구기관으로, LLM 에이전트의 사회적 능력을 연구하는 후즈위안의 방향과 잘 맞닿아 있었습니다.

2023년부터 MAgIC, 대화 시스템 사용자 시뮬레이터, 시 생성 등 다양한 주제의 논문을 꾸준히 발표하며 LLM 에이전트 연구의 여러 단면을 탐구해왔습니다. 2025년에는 EvoArena 연구를 통해 에이전트 메모리와 동적 환경 대응 능력 평가 분야로 연구를 확장했습니다.

업적

후즈위안의 대표 연구는 MAgIC(Multi-Agent in Cognition, Adaptability, Rationality and Collaboration)입니다. 2023년 제안된 이 벤치마크는 두 가지 사회적 추론 게임과 세 가지 게임 이론 시나리오를 활용해 LLM 에이전트가 다중 에이전트 환경에서 어떻게 인지하고, 적응하고, 합리적으로 행동하며, 협력하는지를 체계적으로 평가합니다. EMNLP 2024 메인 트랙에서 발표되었습니다.

2025~2026년 연구의 핵심은 EvoArena입니다. EvoArena는 터미널, 소프트웨어, 사회적 도메인에 걸쳐 환경 변화를 점진적 업데이트 시퀀스로 모델링하는 벤치마크 스위트입니다. 에이전트가 변화하는 환경 상태를 메모리에 어떻게 반영하는지를 측정하며, EvoMem이라는 메모리 모듈이 진화하는 환경 상태를 온전히 보존하는 데 효과적임을 보였습니다. 이 논문은 ICLR 2026에서 발표되었습니다.

대화 시스템 분야에서도 기여가 있습니다. LLM 기반 사용자 시뮬레이터를 활용해 대화 시스템 훈련 및 평가를 개선하는 연구와, 시와 같이 형식과 의미를 동시에 충족해야 하는 텍스트 생성을 확산 모델로 풀어낸 PoetryDiffusion(AAAI 2024) 등을 발표했습니다.

여담

후즈위안의 연구는 LLM 에이전트를 단순히 작업 수행 도구가 아니라 사회적·인지적 주체로 바라보는 시각을 일관되게 유지합니다. MAgIC에서 에이전트의 "인지, 적응성, 합리성, 협업"이라는 네 차원을 설정한 것도 그 시각의 표현입니다. 에이전트가 얼마나 잘 "믿고 의심하고 협상할 수 있는가"라는 물음은 기술적 문제인 동시에 인간-AI 상호작용의 철학적 질문이기도 합니다.

EvoArena는 벤치마크 설계에서 정적인 스냅샷이 아닌 동적 변화 시퀀스를 평가 단위로 삼는 점에서 독창적입니다. 현실 환경에서 에이전트가 마주치는 상황이 고정된 것이 아니라 끊임없이 변한다는 관찰에서 출발한 설계입니다. 이는 기존 벤치마크들이 시험 시점의 스냅샷만 평가한다는 한계를 정면으로 지적하는 연구이기도 합니다.

2025년 말 Thinking Machine Research Grant 수상과 DAAD AInet Fellowship 선발은 그의 연구 방향이 국제 연구 커뮤니티에서 독창성과 파급력을 인정받았음을 보여주는 지표입니다.

주요 논문

MAgIC: Investigation of Large Language Model Powered Multi-Agent in Cognition, Adaptability, Rationality and Collaboration (EMNLP 2024) -- 공동 1저자. 다중 LLM 에이전트의 인지·적응·합리성·협업 벤치마크.
EvoArena (ICLR 2026) -- 공저. 동적 환경에서 LLM 에이전트 메모리 진화 추적 벤치마크.
Unlocking the Potential of User Feedback: Leveraging Large Language Model as User Simulator to Enhance Dialogue System (2024) -- LLM 기반 사용자 시뮬레이터로 대화 시스템 개선.
PoetryDiffusion: Towards Joint Semantic and Metrical Manipulation in Poetry Generation (AAAI 2024) -- 의미와 운율을 동시에 제어하는 확산 모델 기반 시 생성.
GraphTracer: Graph-Guided Failure Tracing in LLM Agents for Robust Multi-Turn Deep Search (arXiv:2510.10581, 2025) -- 그래프 기반 LLM 에이전트 실패 추적.
EvoTest: Evolutionary Test-Time Learning for Self-Improving Agentic Systems (ICLR 2026) -- 공저. 자기 개선 에이전트 시스템의 진화적 테스트 시간 학습.