Kaixuan Liu

🏷️ 인물 강화학습

Kaixuan Liu는 미국 에모리대학교(Emory University) 컴퓨터과학과 소속 연구자로, Shengpu Tang과 함께 오프라인 강화학습과 LLM 에이전트 평가를 연구합니다.

본 논문 Autoregressive Diffusion World Models for Off-Policy Evaluation of LLM Agents의 제1저자입니다. 디퓨전 월드 모델을 단일 스텝 가이드 디노이징으로 자기회귀적으로 굴려, 평가 정책을 매 디노이징 스텝에 주입하는 ADWM의 설계와 실험을 주도했습니다. 같은 에모리대의 Shengpu Tang, 상하이교통대의 Weinan Zhang·Guojun Xiong와 함께했습니다.