Ling Yang

🏷️ 확산모델 강화학습 LLM 에이전트

Ling Yang은 프린스턴 대학교 전기컴퓨터공학과 박사후연구원이자 Princeton AI Lab의 연구 펠로우다. 베이징대학교에서 Bin Cui, Luxia Zhang 교수의 공동 지도 아래 2021년부터 2025년까지 박사 과정을 마치고 프린스턴으로 이동했다. 생성 모델 기초(대규모 언어 모델, 확산 모델), 강화학습, 멀티모달 에이전트 시스템 전반을 아우르는 연구를 진행하며, 이를 묶어 "Super Generative Intelligence"라는 비전 아래 Gen-Verse 연구 그룹을 이끌고 있다.

확산 모델 연구에서 가장 광범위하게 인용되는 성과는 2022년 발표한 확산 모델 종합 서베이(arXiv:2209.00796)다. 확산 모델의 이론, 샘플링, 응용을 체계적으로 정리해 이 분야 입문자들의 필독 문헌이 되었다. 2024-2025년에는 ReasonFlux(NeurIPS 2025 Spotlight)와 MMaDA(오픈소스 멀티모달 확산 언어 모델)를 발표하며 확산 언어 모델(dLLM)과 추론의 융합 가능성을 제시했다. ICLR 2026에는 TraceRL을 포함한 확산 LLM 관련 논문 4편이 accept되었고, ICML 2026에는 에이전트와 멀티모달 RL 관련 논문 6편(1편 스포트라이트)이 포함되었다.

2026년 3월에는 Mengdi Wang 교수 및 프린스턴 팀과 함께 OpenClaw-RL을 발표했다. 배포 중인 에이전트가 사용자와의 대화 자체를 강화학습 신호로 활용해 지속적으로 개선되는 비동기 RL 프레임워크로, 별도의 데이터 수집이나 수동 레이블링 없이 개인화 에이전트와 범용 에이전트를 하나의 파이프라인에서 동시 훈련한다. HuggingFace에서 156 업보트를 기록하며 에이전트 RL 커뮤니티의 주목을 받았다.