Thierry Tambe
Thierry Tambe는 스탠퍼드 대학교 전기공학과 조교수입니다(컴퓨터과학과 겸임). AI와 데이터 집약적 응용을 도메인 특화 하드웨어 위에서 효율적으로 돌리는 알고리즘-실리콘 공동 설계(algorithm-to-silicon co-design)를 연구합니다. 스탠퍼드에 자신의 연구실(Tambe Lab)을 운영합니다.
대표 연구로 EdgeBERT가 있습니다. BERT 같은 트랜스포머 언어 모델을 자원이 빠듯한 엣지 기기에 올릴 때, 엔트로피 기반 조기 종료(early exit)로 문장 단위 동적 전압-주파수 스케일링(DVFS)을 수행해 목표 지연 시간을 지키면서 에너지를 최소화하는 알고리즘-하드웨어 공동 설계입니다. 멀티태스크 NLP를 엣지에서 돌리는 문제를 회로 수준까지 내려가 푼 작업입니다.
스탠퍼드 합류 전에는 하버드와 NVIDIA를 거치며 효율적 딥러닝 가속기를 연구했습니다. 연구의 일관된 방향은 "모델을 작게 만드는 알고리즘"과 "그 모델을 싸게 돌리는 하드웨어"를 따로 보지 않고 한 묶음으로 설계하는 것입니다.
Agent Memory - Characterization and System Implications of Stateful Long-Horizon Workloads 논문에서는 시니어 저자로, 에이전트 메모리를 정확도가 아니라 시스템(연산·에너지·서빙) 문제로 보는 이 연구의 관점을 이끌었습니다. 같은 논문에 Yasmine Omri, Alex Pentland, Tsachy Weissman, Marian Verhelst 등이 참여했습니다.