린준양

개요

Junyang Lin(林俊扬)은 중국의 AI 연구자로, Alibaba DAMO Academy 재직 시절 Qwen 팀의 공식 테크 리드를 역임했습니다. 베이징 대학교에서 컴퓨터 과학과 언어학을 공부한 뒤 2019년 Alibaba에 합류했으며, Alibaba Cloud 역사상 가장 젊은 P10급 테크니컬 엑스퍼트 중 한 명으로 알려져 있습니다. 2026년 3월 Alibaba를 떠났습니다.

Qwen 테크 리드로서 Qwen 시리즈 전 세대의 기술 방향을 이끌었습니다. 2026년 1월 기준 Qwen 모델군은 Hugging Face에서 누적 7억 회 이상 다운로드됐고, 오픈소스 커뮤니티에서 약 18만 개의 파인튜닝 파생 모델이 생성됐습니다. M6, OFA, Chinese-CLIP 등 그가 참여한 프로젝트들은 중국 AI 연구의 국제적 가시성을 끌어올리는 데 기여했습니다.

생애

베이징 대학교에서 컴퓨터 과학과 언어학을 전공한 뒤, 2019년 Alibaba에 시니어 알고리즘 엔지니어로 입사했습니다. 초기에는 NLP 및 멀티모달 연구에 집중했으며, 초대형 혼합 전문가 모델 M6와 멀티모달 멀티태스크 모델 OFA를 통해 연구 역량을 인정받았습니다. Alibaba Cloud 내에서 빠르게 승진해 P10급 테크니컬 엑스퍼트 직위에 올랐는데, 이는 회사 역사상 최연소 사례 중 하나로 기록됩니다.

2023년 Qwen 팀의 공식 테크 리드로 취임하면서 대외적으로도 Qwen의 얼굴이 됐습니다. 컨퍼런스 발표, SNS 활동, 오픈소스 커뮤니티 소통 등을 통해 Qwen 브랜드를 적극적으로 알렸습니다. 2026년 3월 3일, Qwen 팀이 Qwen 3.5 소형 모델 시리즈를 출시한 지 24시간 만에 X(구 트위터)에 "me stepping down. bye my beloved qwen."이라는 짧은 글을 남기고 Alibaba를 떠났습니다. 같은 날 포스트트레이닝 팀장 Yu Bowen도 퇴사했으며, Qwen Code 팀장 Huibin은 이미 2026년 1월 Meta로 이직한 상태였습니다.

업적

M6(Multi-Modality to Multi-Modality Multitask Mega-transformer)는 중국어 멀티모달 사전학습 데이터셋 역사상 최대 규모인 이미지 1.9TB, 텍스트 292GB를 구축하고, 10억 파라미터에서 100억 파라미터 규모까지 확장한 모델입니다. 멀티모달 생성과 이해를 단일 모델로 통합한 초기 사례 중 하나입니다.

OFA(One-For-All)는 ICML 2022에 발표된 멀티모달 멀티태스크 모델로, 이미지 캡셔닝, 시각 질문 응답, 텍스트 요약 등 이질적인 태스크를 단일 아키텍처와 시퀀스-to-시퀀스 프레임워크로 통합했습니다. 700회 이상 인용됐으며, 범용 멀티모달 모델 연구의 초기 이정표로 평가됩니다.

Chinese-CLIP은 중국어 비전-언어 표현 학습의 실용적 기준점을 마련한 오픈소스 모델로, 크로스모달 검색과 표현 생성 분야에서 널리 사용됩니다. 2,000개 이상의 GitHub 스타를 받았습니다.

Qwen 테크 리드로서의 가장 큰 업적은 Qwen 시리즈를 글로벌 오픈소스 AI 생태계에서 최상위권 모델로 자리매김시킨 것입니다. NeurIPS 2025에서는 Gated Attention 논문이 Best Paper Award와 Oral 발표(상위 1.5%)를 동시에 수상했으며, Lin은 시니어 저자로 이름을 올렸습니다.

여담

린준양의 퇴사는 단순한 이직을 넘어 중국 AI 업계의 인재 이탈 논쟁에 불을 붙였습니다. 10주 안에 Qwen의 시니어 기술 리더 세 명이 잇달아 떠났기 때문입니다. 퇴사 발표 직후 동료들의 아쉬운 반응이 공개 SNS에 쏟아졌고, 일각에서는 이 이탈이 자발적이지 않았을 가능성을 제기하기도 했습니다.

퇴사 이후 행보는 공개되지 않았습니다. 다만 그가 구축한 Qwen 오픈소스 생태계는 퇴사 이후에도 18만 개 이상의 파인튜닝 파생 모델을 통해 계속 살아 있습니다. 중국어 AI 커뮤니티에서 린준양이 남긴 유산은 모델 자체보다 오픈소스 문화를 정착시킨 데 있다는 평가도 있습니다.

주요 논문

M6: A Chinese Multimodal Pretrainer (arXiv 2021)
M6-10T: A Sharing-Delinking Paradigm for Efficient Multi-Trillion Parameter Pretraining (arXiv 2021)
OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework (ICML 2022)
Chinese-CLIP: Contrastive Vision-Language Pretraining in Chinese (arXiv 2022)
Qwen Technical Report (arXiv 2023)
Qwen2 Technical Report (arXiv 2024)
Qwen2.5 Technical Report (arXiv 2025)
Gated Attention for Large Language Models - Non-linearity, Sparsity, and Attention-Sink-Free (NeurIPS 2025 Best Paper, arXiv:2505.06708)
Qwen3 Technical Report (arXiv 2025)
Qwen3-VL Technical Report (arXiv 2025)