자오펑위

🏷️ LLM

개요

자오펑위(赵鹏宇, Zhao Pengyu)는 MiniMax LLM 팀장으로, MiniMax가 출시한 주요 언어 모델 시리즈 전반을 총괄하는 수석 연구자입니다. MiniMax-Text-01부터 MiniMax-M1, M2, M2.5-Lightning, MiniMax Sparse Attention 기술 보고서, 그리고 M3에 이르는 거의 모든 시리즈에서 시니어 저자로 이름을 올렸습니다. 2025년 6월에는 MiniMax 이사(Executive Director)로 승진하며 LLM 연구와 엔지니어링 전체를 공식 관장하게 되었습니다.

생애

자오펑위는 베이징대학교 컴퓨터과학기술학과에서 학사(2017)와 석사(2020)를 마쳤습니다. 이후 연구직과 산업계 경력을 쌓다가 2023년 8월 MiniMax에 합류해 LLM 팀장 직책을 맡았습니다. 합류 초기부터 장문 컨텍스트 처리, 추론 능력 강화, 효율적 학습·추론 인프라 세 축을 중심으로 팀을 구성하고 연구 방향을 정립했습니다.

MiniMax에서 처음 이름을 알린 것은 MiniMax-Text-01 시리즈였습니다. 이후 MiniMax-M1 출시 당시에는 512대의 H800 GPU로 3주 만에 전체 RL 훈련을 완료하는 속도로 주목받았으며, 40K·80K 두 가지 thinking budget 버전을 동시 공개했습니다. 2025년 이후에는 M2, M2.1, M2.5-Lightning을 연달아 출시했고, M2.7과 M3까지 시리즈를 이어갔습니다.

업적

자오펑위의 핵심 기여는 MiniMax 언어 모델 시리즈의 아키텍처 설계와 훈련 파이프라인 총괄입니다. MiniMax-M2는 선형 어텐션을 적용한 대규모 Mixture-of-Experts 아키텍처로 장문 컨텍스트 추론 효율을 크게 높였습니다. M2.1은 특히 다국어 프로그래밍 성능을 강화해 실세계 복잡 태스크 대응 능력을 끌어올렸습니다.

MiniMax Sparse Attention 논문에서는 라이쉰하오 등 연구팀과 함께 GQA 그룹 단위 경량 인덱서 설계와 GPU 커널 공동 최적화를 총괄했습니다. 이 기술은 MiniMax M3의 핵심 구성요소로 직접 배포되었으며, 백만 토큰 이상의 문서, 대형 코드베이스, 이미지·비디오 입력과 컴퓨터 사용 자동화까지 M3의 다목적 처리 능력을 뒷받침합니다. 또한 수학적 추론 데이터셋 SynLogic과 수학 증명 검증 도구 MaxProof 공개 시에도 총괄 역할을 맡았습니다.

여담

자오펑위는 MiniMax M2 출시 당시 X(트위터)에 직접 기술 블로그를 올려 아키텍처 결정과 사전학습 전략을 설명했습니다. 이 같은 팀 대외 소통 방식은 MiniMax가 중국 AI 스타트업 중에서도 투명성 높은 기술 공유로 차별화되는 데 기여했습니다. 2025년 이후 MiniMax 모델이 Google Cloud Vertex AI와 NVIDIA NeMo에서 공식 제공되기 시작했다는 점도, 그가 이끈 LLM 팀의 성과가 외부 플랫폼에서도 인정받고 있음을 보여줍니다.

주요 논문

MiniMax-Text-01 기술 보고서
MiniMax-M1 기술 보고서 (2025)
MiniMax-M2 기술 보고서 (2025)
MiniMax Sparse Attention (arXiv:2606.13392, 2026) -- MiniMax Sparse Attention 참고
MiniMax M3 기술 보고서 (2026)
SynLogic 수학 추론 데이터셋 (공동 공개)