Zechun Liu
Zechun Liu(류저춘)는 메타(Reality Labs)에서 대형 언어모델 양자화를 연구합니다.
대표 작업이 압축·온디바이스 효율화 라인입니다. SpinQuant는 작은 검증셋에서 Cayley 최적화로 회전 행렬을 학습해 양자화 품질을 끌어올려, 가중치·활성·KV 캐시 4비트에서 LLaMA-2 7B 기준 풀정밀 대비 격차를 2.9점까지 좁혔습니다(LLM-QAT 대비 +19.1점). LLM-QAT는 데이터 없이 진행하는 양자화 인식 학습이고, MobileLLM은 10억 파라미터 미만 모델을 온디바이스용으로 최적화한 작업입니다.
본 논문 Quantized Reasoning Models Think They Need to Think Longer, but They Do Not에는 양자화 분야 대표 연구자로 합류했습니다. 이 논문이 다루는 GPTQ·AWQ·FlatQuant 같은 사후학습 양자화(PTQ)와 회전 기반 기법(QuaRot·SpinQuant)은 그의 전공 그대로이고, "양자화가 추론 모델의 행동을 어떻게 망가뜨리나"라는 질문에 압축 전문성을 보탭니다.
1저자 Sanae Lotfi, 공저자 Polina Kirichenko와 함께 작업했습니다.