Jiachen Lei
알리바바 AMAP-ML 소속 연구원으로 비디오 생성 아키텍처와 인터랙티브 월드 모델 두 방향을 함께 연구합니다.
대표 연구는 "There is No VAE: End-to-End Pixel-Space Generative Modeling via Self-Supervised Pre-Training"(arXiv:2510.12586, ICLR 2026)입니다. 기존 잠재 확산 모델이 의존하는 VAE 인코더를 제거하고 픽셀 공간에서 직접 생성 모델을 학습하는 방식으로, 인코딩·디코딩 과정의 정보 손실과 지연을 줄이는 접근입니다.
세계 모델 평가 측에서는 Omni-WorldBench 공동 저자로 참여해 인터랙션 중심 4D 월드 모델 벤치마크 구축에 기여했습니다.
DreamX-World 1.0에서는 DreamX Team의 일원으로 카메라 제어·장기 생성·메모리 일관성 파이프라인 전반에 걸쳐 역할을 담당했습니다. Xiangxiang Chu, Jiashu Zhu와 함께 AMAP-ML의 인터랙티브 월드 모델 연구를 이끌고 있습니다.