Sanae Lotfi
Sanae Lotfi는 메타 Fundamental AI Research(FAIR) 팀의 리서치 사이언티스트입니다(현재 Meta Superintelligence Labs 소속으로도 표기).
연구 주제는 딥러닝의 과학, 특히 신경망의 일반화입니다. 모델 압축과 손실곡면 분석처럼 일반화와 연결되는 개념으로 "왜 잘 일반화되는가"를 설명하려 합니다. 베이지안 학습, 확률적 생성모델, 통계적 학습이론으로 관심이 뻗습니다. NYU에서 Andrew Gordon Wilson 지도로 박사를 했고, 그 전 Polytechnique Montreal에서 응용수학 석사를 했습니다. 베이지안 모델 선택으로 ICML 2022 Outstanding Paper Award를, "압축의 관점으로 LLM 일반화 이해"로 ICML 2024 이론 워크숍 Best Paper를 받았고, MIT·메릴랜드대 Rising Star로 선정됐습니다.
본 논문 Quantized Reasoning Models Think They Need to Think Longer, but They Do Not의 1저자 겸 교신저자입니다. "압축(양자화)이 추론 트레이스를 토큰 수준에서 어떻게 바꾸는가"를 KL 발산으로 진단하는 이 논문의 접근은, 압축을 통해 모델의 행동을 이해하려는 그의 오랜 관심사와 정확히 맞닿아 있습니다.
OOD·강건성 연구자 Polina Kirichenko, 양자화 전문가 Zechun Liu와 함께 작업했습니다.