데이비드 아이겐
개요
데이비드 아이겐(David Eigen)은 미국의 컴퓨터 비전 연구자로, 단일 이미지로부터 깊이 맵을 예측하는 다중 스케일 신경망 방법론을 제안해 이 분야의 연구 표준을 정립한 인물입니다. Google Scholar 기준 피인용 수 19,000회 이상으로 컴퓨터 비전 분야에서 인용 영향력이 높은 연구자에 속합니다.
단일 이미지 깊이 추정(monocular depth estimation)은 스테레오 카메라나 LiDAR 없이 2D 사진 한 장으로 픽셀별 거리 정보를 복원하는 문제입니다. 아이겐은 이를 전역(coarse) 예측과 지역(fine) 예측을 결합하는 다중 스케일 구조로 해결해 당시 기준에서 큰 정확도 향상을 달성했습니다. 이 접근법은 이후 수많은 깊이 추정 논문의 기준점(baseline)이 되었습니다.
박사 학위 이후에는 Clarifai에서 연구 과학자로 재직하며 산업 현장의 컴퓨터 비전 문제에 신경망 기법을 적용하는 작업을 이어오고 있습니다.
생애
아이겐은 뉴욕대학교(NYU) Courant Institute에서 박사 과정을 밟았습니다. 지도교수는 컴퓨터 비전과 딥러닝 분야의 저명한 연구자 롭 퍼거스였으며, 약 2010년부터 2015년에 걸쳐 학위 과정을 마쳤습니다.
박사 논문의 핵심 주제는 합성곱 신경망(CNN)을 이용해 이미지로부터 이미지 자체를 예측하는 것이었습니다. 픽셀 단위로 깊이, 표면 법선, 의미 분할 레이블을 동시에 출력하는 구조를 설계하고 검증하는 것이 논문의 기여였습니다. 이 과정에서 그는 대규모 사전 학습 모델을 활용해 픽셀 예측 정확도를 높이는 방향을 탐구했고, 그 결과가 두 편의 주요 학회 논문으로 발표되었습니다.
박사 학위 취득 후에는 Clarifai에 연구 과학자로 합류했습니다. Clarifai는 컴퓨터 비전, 대형 언어 모델, 오디오 모델을 아우르는 AI 플랫폼을 운영하는 기업으로, 이미지 이해와 분류 분야에서 기업용 서비스를 제공해 왔습니다. 2026년에는 Clarifai의 컴퓨트 오케스트레이션 기술이 Nebius에 인수되는 변화가 있었습니다.
업적
아이겐의 대표 논문은 2014년 NIPS(현 NeurIPS)에서 발표한 Depth Map Prediction from a Single Image using a Multi-Scale Deep Network(Eigen, Puhrsch, Fergus)입니다. 이 논문에서 그는 두 단계 네트워크를 제안했습니다. 첫 번째 네트워크가 이미지 전체를 보고 대략적인 깊이 맵을 예측하고, 두 번째 네트워크가 지역 패치 단위로 이를 정밀화하는 구조입니다. NYU Depth V2와 KITTI 벤치마크에서 당시 최고 성능을 기록했습니다.
후속 논문인 Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Architecture(ICCV 2015)에서는 하나의 다중 스케일 합성곱 신경망으로 깊이, 표면 법선, 의미 분할 세 가지를 동시에 예측하는 구조를 제안했습니다. 세 과제를 단일 네트워크로 처리하면서도 각 출력의 품질을 유지한 점이 주목을 받았습니다.
OverFeat 프로젝트에서도 아이겐의 기여가 있었습니다. 분류 신경망의 특징 추출 층을 유지하면서 마지막 단을 4차원 좌표 회귀로 교체하는 Localization Network 설계가 그의 역할이었습니다. 이 방식은 객체 탐지(object detection)에서 경계 상자(bounding box) 회귀의 효율적인 구현법으로 자리 잡았습니다.
여담
아이겐이 박사 과정 중 발표한 깊이 추정 논문은 이후 단안 깊이 추정 연구의 표준 평가 지표 설정에도 영향을 미쳤습니다. 그가 사용한 오류 지표들(AbsRel, SqRel, RMSE, log scale RMSE)은 2025년 현재까지도 이 분야 논문에서 보편적으로 사용되는 기준입니다.
Clarifai가 속한 컴퓨터 비전 플랫폼 시장에서 2026년 들어 인프라 기업의 기술 인수가 활발해지는 흐름이 관찰됩니다. 이런 변화 속에서 아이겐이 쌓아온 픽셀 수준 예측 기술 기반이 다양한 형태로 이어지고 있습니다.
주요 논문
- Depth Map Prediction from a Single Image using a Multi-Scale Deep Network (Eigen, Puhrsch, Fergus, NIPS 2014) - 단일 이미지 깊이 추정의 표준 방법론
- Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Architecture (Eigen, Fergus, ICCV 2015) - 3개 픽셀 예측 작업을 단일 망으로 처리
- OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks (Sermanet 외, ICLR 2014) - 분류·위치·탐지 통합 신경망
- Understanding Deep Architectures using a Recursive Convolutional Network (Eigen 외, 2014) - 재귀적 합성곱 네트워크 분석
- Restoring an Image Taken through a Window Covered with Dirt or Rain (Eigen 외, ICCV 2013) - 창문 오염 제거 이미지 복원