웨이쉬안
개요
웨이쉬안(Wei Xuan)은 샤먼대학교(Xiamen University) 소속 박사과정 연구원으로, 바이두(Baidu) ERNIE Team에서 인턴 연구를 수행하고 있습니다. 영상 생성, 확산 모델, 멀티샷 일관성 등 영상처리 분야에 집중하고 있는 초기 경력 연구자입니다.
장기 멀티샷 영상 생성에서 반복 등장 인물의 정체성을 유지하는 문제를 연구의 중심 과제로 삼고 있습니다. 기존 접근법이 시간적 어텐션이나 잠재 혼합에 의존하던 것과 달리, 이 문제를 명시적인 아이덴티티 고정(identity grounding) 문제로 재정의한 것이 주목할 만한 기여입니다.
홍칭치(Qingqi Hong) 교수의 지도와 장전위(Zhenyu Zhang) 프로젝트 리더의 협력 아래 연구를 이어가고 있습니다. 2026년 발표한 Memento 논문에서 공동 제1저자를 맡아 핵심 아키텍처 설계를 주도했습니다.
생애
웨이쉬안에 대한 공개된 상세 이력은 현재 제한적입니다. 샤먼대학교 박사과정에 재학 중이며, 바이두 ERNIE Team 인턴십을 병행하면서 산학 연계 형태로 연구를 진행하고 있습니다.
샤먼대학교는 중국 복건성에 위치한 주요 국립대학으로, 컴퓨터과학 및 인공지능 분야에서 활발한 연구를 수행하고 있습니다. 웨이쉬안은 이 환경에서 영상 생성 모델의 일관성 문제에 관심을 갖게 된 것으로 보입니다.
바이두 ERNIE Team은 대규모 멀티모달 모델 연구의 중심지로, 2026년 ERNIE 5.0 및 5.1 공개 이후 영상 생성 분야에서도 연구 역량을 강화하고 있습니다. 웨이쉬안은 이 팀에서의 인턴십을 통해 산업 규모의 생성 모델 개발 경험을 쌓고 있습니다.
업적
웨이쉬안의 핵심 기여는 2026년 발표한 Memento - Reconstruct to Remember for Consistent Long Video Generation(arXiv:2606.14667)입니다. 이 논문에서 제1저자로서 장기 멀티샷 영상 생성의 인물 일관성 문제를 체계적으로 접근하는 프레임워크를 설계했습니다.
Memento의 핵심 아이디어는 이중 경로 메모리 메커니즘입니다. 각 샷이 새로 시작될 때마다 이전 샷에서 등장했던 인물의 외형 정보를 명시적으로 재구성(reconstruct)하여 다음 샷의 생성 조건에 주입하는 방식을 취합니다. 여기에 피사체 재구성 보조 학습(subject reconstruction auxiliary training)을 결합해 모델이 인물 특징을 더 정확하게 유지하도록 훈련했습니다.
이 접근법은 긴 영상에서 인물이 여러 번 재등장할 때 발생하는 정체성 드리프트(identity drift) 문제를 효과적으로 완화합니다. 단순한 어텐션 조작이 아니라 명시적 재구성을 통한 기억(memory) 개념을 도입했다는 점에서, 장기 영상 생성 연구의 방향에 기여하는 작업으로 평가됩니다.
여담
Memento라는 이름은 기억과 잊음을 주제로 한 크리스토퍼 놀란 감독의 동명 영화에서 영감을 받은 것으로 보입니다. 영상 생성 모델이 이전 샷의 인물을 "기억"해야 한다는 연구 주제와 잘 맞닿아 있는 명명입니다.
박사과정 중에 대형 AI 기업의 연구팀에서 인턴을 병행하는 방식은 중국 AI 연구 생태계에서 흔히 볼 수 있는 경로입니다. 바이두 ERNIE Team이라는 산업 현장의 연산 자원과 데이터를 활용하면서도 학술적 기여를 제1저자로 주도했다는 점이 인상적입니다.
논문의 공저자 목록에는 바이두 소속 연구자들도 포함되어 있어, 이 연구가 단순한 인턴 프로젝트를 넘어 실질적인 협업의 결과물임을 보여줍니다.
주요 논문
- Memento - Reconstruct to Remember for Consistent Long Video Generation (arXiv:2606.14667, 2026) - 장기 멀티샷 영상 생성에서 인물 정체성 일관성을 유지하는 이중 경로 메모리 프레임워크, 제1저자