Min-Hung Chen
NVIDIA Research Taiwan의 Staff Research Scientist로, Vision+X 멀티모달 AI를 연구합니다. 미국 조지아공대(Georgia Tech)에서 Ghassan AlRegib 교수와 Zsolt Kira 교수의 공동 지도 아래 박사학위를 취득했습니다. 이전에는 Microsoft Azure AI와 MediaTek AI에 재직했습니다.
연구 관심사는 Vision-Language 모델, 4D(영상+깊이) 이해, 효율적 딥러닝, VLA(Vision-Language-Action), 트랜스포머, 그리고 도메인 적응 및 전이 학습을 포함한 불완전 지도 학습 전반에 걸쳐 있습니다.
SpatialClaw 논문에서 시니어 저자이자 교신 저자 역할을 담당했습니다. SpaceTools(SpaceTools-Toolshed, 2026) 등 사전 연구를 통해 축적한 구조화 도구 호출(structured tool-call) 방식의 한계를 직접 파악하고, 코드 기반 행동 인터페이스로 전환하는 방향을 이끈 것으로 보입니다. NVIDIA Research Taiwan의 공간 지능 연구 방향을 실질적으로 조율하는 위치에 있습니다.
SpatialClaw - Rethinking Action Interface for Agentic Spatial Reasoning 논문의 시니어 저자.