Hongcheng Gao
Hongcheng Gao(高宏成)는 칭화대 College of AI의 박사과정 연구자입니다. 연구 관심은 대규모 추론 모델, AI 에이전트, 그리고 텍스트와 멀티모달을 아우르는 통합 모델이며, 그중에서도 공간(spatial) 과제에 무게를 둡니다. 개인 페이지는 hongcheng-gao.github.io입니다.
에이전트 벤치마크 쪽 이력이 분명합니다. NeurIPS 2024에 발표된 Spider2-V 공저자로 이름을 올렸는데, 이 벤치마크는 멀티모달 에이전트가 데이터 사이언스·엔지니어링 워크플로를 GUI 조작까지 포함해 끝까지 자동화할 수 있는지를 묻는 작업이었고, 당대 최고 모델조차 14% 성공률에 그쳤습니다. "현 세대 에이전트가 실제 작업에서 얼마나 못 하는지"를 정량화하는 문제의식이 SpatialWorld - Benchmarking Interactive Spatial Reasoning of Multimodal Agents in Real-World Tasks로 이어졌다고 볼 수 있습니다.
본 논문에서는 공동 1저자(equal contribution)이자 핵심 설계자로 참여했습니다. 8개 시뮬레이터를 하나의 텍스트 기반 액션 인터페이스로 묶는 통합 프로토콜이 이 논문의 척추인데, 그 추상화 설계가 그의 통합 모델·에이전트 관심사와 정확히 맞물립니다. corresponding author인 Yinpeng Dong과 같은 칭화대 라인입니다.