Yang Zhilin

🏷️ LLM 강화학습

Yang Zhilin(杨植麟, 1992년생)은 중국 광둥성 산터우 출신의 AI 연구자이자 기업가로, 대형 언어 모델 회사 Moonshot AI(月之暗面)의 공동 창업자 겸 CEO다. 칭화대학교 컴퓨터과학과를 수석으로 졸업한 뒤 카네기멜런대학교(CMU) 박사 과정에 입학해 4년 미만 만에 학위를 취득했다. CMU 재학 중 Google Brain에서 인턴을 했으며, Meta AI Research(FAIR)에서도 연구 경험을 쌓았다.

대표 연구는 CMU·Google Brain 공동 작업으로 탄생한 Transformer-XL(2019, ACL)과 XLNet(2019, NeurIPS Oral)이다. Transformer-XL은 고정 크기 컨텍스트 문제를 세그먼트 단위 순환 구조로 해결해 긴 의존성 모델링의 기준을 높였고, XLNet은 이 위에 퍼뮤테이션 기반 자기회귀 학습을 도입해 BERT를 20개 표준 태스크 중 18개에서 능가했다. 박사 논문 발표 당시 두 논문 모두 누적 인용이 수천 건에 이르는 등 LLM 사전학습 연구에서 핵심 레퍼런스로 꼽혔다.

2023년 3월 동료 연구자들과 Moonshot AI를 창업한 뒤, 이 회사의 첫 제품 Kimi Chat을 같은 해 10월 출시했다. Kimi는 초기부터 수십만 한자 규모의 긴 컨텍스트를 강점으로 내세웠으며, 2025년 1월 추론 모델 Kimi K1.5, 동년 여름 MoE 기반 Kimi K2, 그리고 2026년 2월 200만 토큰 컨텍스트를 지원하는 멀티모달 에이전트 Kimi K2.5를 순차적으로 공개했다. 2026년 3월 NVIDIA GTC에서는 Kimi K2.5의 기술 로드맵을 직접 발표하며 어텐션 메커니즘, 옵티마이저, 잔차 연결 등 Transformer 핵심 구조를 재설계하는 방향을 제시했다.

Yang Zhilin이 이달의 인물로 선정된 맥락은 Kimi K2.5 논문(arXiv:2602.02276)이 2026년 2월 공개되면서다. 이 논문은 강화학습 기반 2단계 훈련(Agentic RL + RLVR)과 200만 토큰 멀티모달 컨텍스트를 결합해 VLM을 단순 인식 모델에서 에이전트로 전환하는 체계를 제시했으며, Web Agents 벤치마크에서 GPT-4o 대비 13.5%p 높은 수치를 기록하며 커뮤니티의 주목을 받았다.