JD Explore Academy

🏷️ 머신러닝 영상처리

JD Explore Academy는 JD.COM(징둥)의 AI 연구 조직입니다. Vision and Multimodal Lab을 Nan Duan 디렉터가 이끌고 있고, 산하 시니어 연구자로 Lin Song 등이 포진해 있습니다. Tencent ARC Lab, MSRA에서 옮겨온 비전·멀티모달 연구자들의 합류처 역할을 해왔습니다.

학계 협업이 강한 편입니다. USTC(Feng Zhao 연구실), Peking University, 톈진대 등과 공동 1저자 논문을 다수 내고, 시니어 라인은 JD Explore Academy 측이 차지하는 식의 협업 구조가 자주 보입니다. OmniNFT 역시 USTC 학생(Guohui Zhang 1저자, Feng Zhao 교신)과 JD Explore Academy 측 시니어(Lin Song project leader, Nan Duan 등)가 결합된 형태입니다.

비디오 생성·오디오 생성·joint AV generation 같은 컴퓨트가 무거운 시각 생성 라인이 자연스러운 협업 토픽입니다. 본 OmniNFT 작업은 19B 파라미터 LTX-2 backbone에 RL fine-tuning을 돌리는 셋업이라 산업 랩의 인프라가 받쳐주는 협업 구조와 잘 들어맞습니다.