Yueyi Sun

🏷️ 인물 멀티모달 확산모델

개요

웨이이 쑨(Yueyi Sun)은 베이징대학교 소속으로 ByteDance와의 협업 아래 멀티모달 인식·생성 모델을 연구합니다. SAM2와 LLaVA를 결합해 이미지·비디오의 밀집 그라운딩을 다루는 Sa2VA의 공저자이며, ByteDance 인턴십 기간 중 작업을 수행했습니다.

PerceptionDLM - Parallel Region Perception with Multimodal Diffusion Language Models의 공동 1저자로, 확산 언어 모델 기반 병렬 영역 인식 아키텍처를 설계했습니다.