Seokju Cho
KAIST 소속 컴퓨터비전 연구자로, NVIDIA 와의 협업 체제 하에 공간 추론 에이전트 연구를 진행하고 있습니다. Google Scholar 기준 약 1,000건 이상의 인용을 보유하며, 밀집 대응(dense correspondence) 및 시각적 매칭 분야를 중심으로 성과를 쌓아왔습니다.
SpatialClaw 논문에서 제1저자를 맡아 핵심 아이디어인 "행동 인터페이스(action interface) 설계가 도구의 종류보다 에이전트 성능을 더 크게 좌우한다"는 가설을 정립하고, persistent Python kernel 기반의 프레임워크를 설계했습니다. Seungryong Kim 교수의 연구실에서 훈련된 시각적 추론 기반 위에, NVIDIA 인식 팀의 도구 생태계(Abhishek Badki, Sifei Liu)를 결합하는 작업을 주도했습니다.
대응 추정 및 광학 흐름 분야에서 학습한 다중 시점 기하 이해가 SpatialClaw 설계에 직접적으로 반영된 것으로 보입니다. 카메라 모션 및 다중 시점 추론 카테고리에서 SpatialClaw의 향상 폭이 가장 크게 나타난 점이 이를 뒷받침합니다.
SpatialClaw - Rethinking Action Interface for Agentic Spatial Reasoning 논문의 제1저자.