Pierre Sermanet

피에르 세르마네(Pierre Sermanet)는 프랑스 출신의 컴퓨터 비전·로보틱스 연구자로, 2014년 OverFeat 논문의 1저자이자 현재 Google DeepMind 로보틱스 그룹의 연구 과학자이다.

학력은 NYU Courant Institute에서 얀 르쿤 지도로 2014년 1월 박사 학위를 받았다. 박사 논문 제목은 A Deep Learning Pipeline for Image Understanding and Acoustic Modeling이고, 박사 과정 중 발표한 교통 표지 인식(IJCNN 2011, GTSRB 우승)과 비지도 다단계 특징 학습 기반 보행자 검출(CVPR 2013) 작업이 이후 OverFeat의 슬라이딩 윈도우·다중 스케일 평가 설계로 직접 이어진다.

OverFeat에서 그의 기여는 분류·위치·검출 세 작업을 한 망으로 묶는 통합 파이프라인과 합성곱이 곧 슬라이딩 윈도우다라는 평가 방식의 정식화이다. 이 작업으로 ILSVRC 2013 위치 추정 부문에서 우승하였다.

박사 후 곧장 Google Brain의 로보틱스 그룹에 합류하였다. 대표적인 후속 연구는 Time-Contrastive Networks(CoRL 2017)로, 사람 시연 영상에서 자기지도로 로봇 정책을 학습하는 프레임을 제안하였다. 이후 SayCan과 같은 LLM·로봇 결합 연구의 토대가 되는 자기지도 표현 학습을 이어가고 있다. 2024년 Google Brain과 DeepMind가 통합된 이후에는 Google DeepMind 소속이다.