Abhishek Badki

🏷️ 인물 컴퓨터비전

NVIDIA Learning and Perception Research(LPR) 팀의 수석 연구 과학자(Senior Research Scientist)입니다. 자율 기계를 위한 인식 기술 전반, 특히 스테레오 깊이 추정, 광학 흐름, 물체 자세 추정, 3D 형상 추정에 집중해 왔습니다.

대표 연구로는 IEEE CVPR 2020에서 발표한 Bi3D가 있습니다. 이 연구는 깊이 추정을 이진 분류(binary classification) 시리즈로 재구성해, 전통적인 회귀 기반 방식과 다른 유연성을 제공합니다. 이후에는 L4P라는 범용 4D 인식 아키텍처를 개발해, 깊이 및 광학 흐름 등 밀집 태스크에서 전문화 방법과 동등하거나 더 뛰어난 성능을 피드포워드 방식으로 달성했습니다. 스테레오-광학 흐름 시공간 대응을 통합한 연구도 수행했습니다.

SpatialClaw에서는 SAM3(3D 분할), DA3(깊이 인식) 등 핵심 인식 도구를 설계하고 통합하는 역할을 담당했습니다. persistent Python kernel이 도구 출력을 변수로 보존하고 scipy/numpy 연산과 자유롭게 조합할 수 있도록 하는 설계는 Badki의 저수준 인식 경험에서 직접 영향을 받은 것으로 보입니다.

SpatialClaw - Rethinking Action Interface for Agentic Spatial Reasoning 논문의 공동 저자.