피에르 세르마네

🏷️ 인물 딥러닝 NeurIPS논문

피에르 세르마네(Pierre Sermanet)는 프랑스 출신의 컴퓨터 비전·로보틱스 연구자로, 2014년 OverFeat 논문의 1저자이자 현재 Google DeepMind 로보틱스 그룹의 연구 과학자입니다.

학력은 NYU Courant Institute에서 얀 르쿤 지도로 2014년 1월 박사 학위를 받았습니다. 박사 논문 제목은 A Deep Learning Pipeline for Image Understanding and Acoustic Modeling이고, 박사 과정 중 발표한 교통 표지 인식(IJCNN 2011, GTSRB 우승)과 비지도 다단계 특징 학습 기반 보행자 검출(CVPR 2013) 작업이 이후 OverFeat의 슬라이딩 윈도우·다중 스케일 평가 설계로 직접 이어집니다.

OverFeat에서 그의 기여는 분류·위치·검출 세 작업을 한 망으로 묶는 통합 파이프라인합성곱이 곧 슬라이딩 윈도우다라는 평가 방식의 정식화입니다. 이 작업으로 ILSVRC 2013 위치 추정 부문에서 우승하였습니다.

박사 후 곧장 Google Brain의 로보틱스 그룹에 합류하였습니다. 대표적인 후속 연구는 Time-Contrastive Networks(CoRL 2017)로, 사람 시연 영상에서 자기지도로 로봇 정책을 학습하는 프레임을 제안하였습니다. 이후 SayCan과 같은 LLM·로봇 결합 연구의 토대가 되는 자기지도 표현 학습을 이어가고 있습니다. 2024년 Google Brain과 DeepMind가 통합된 이후에는 Google DeepMind 소속입니다.