가오훙청
Hongcheng Gao(高宏成)는 칭화대 College of AI의 박사과정 연구자입니다. 연구 관심은 대규모 추론 모델, AI 에이전트, 그리고 텍스트와 멀티모달을 아우르는 통합 모델이며, 그중에서도 공간(spatial) 과제에 무게를 둡니다. 개인 페이지는 hongcheng-gao.github.io입니다.
에이전트 벤치마크 쪽 이력이 분명합니다. NeurIPS 2024에 발표된 Spider2-V 공저자로 이름을 올렸는데, 이 벤치마크는 멀티모달 에이전트가 데이터 사이언스·엔지니어링 워크플로를 GUI 조작까지 포함해 끝까지 자동화할 수 있는지를 묻는 작업이었고, 당대 최고 모델조차 14% 성공률에 그쳤습니다. "현 세대 에이전트가 실제 작업에서 얼마나 못 하는지"를 정량화하는 문제의식이 SpatialWorld - Benchmarking Interactive Spatial Reasoning of Multimodal Agents in Real-World Tasks로 이어졌다고 볼 수 있습니다.
본 논문에서는 공동 1저자(equal contribution)이자 핵심 설계자로 참여했습니다. 8개 시뮬레이터를 하나의 텍스트 기반 액션 인터페이스로 묶는 통합 프로토콜이 이 논문의 척추인데, 그 추상화 설계가 그의 통합 모델·에이전트 관심사와 정확히 맞물립니다. corresponding author인 둥인펑과 같은 칭화대 라인입니다.