왕마오취안

개요

왕마오취안(Maoquan Wang)은 Microsoft Research 소속 연구 과학자입니다. LLM 기반 코딩 에이전트가 대형 레포지토리를 탐색하는 과정에서 발생하는 비효율을 정량 분석하고, 이를 해소하기 위한 경량 탐색 전용 서브에이전트를 훈련하는 연구를 이끌고 있습니다. 2026년 6월 arXiv에 공개한 FastContext 논문으로 LLM 코딩 에이전트 커뮤니티에서 주목받았습니다.

생애

공개된 이력에 따르면 왕마오취안은 Microsoft Research에서 연구 과학자로 재직하며 에이전트 AI와 LLM 코딩 시스템 분야를 연구해 왔습니다. 장샤오치우와 함께 Microsoft CoreAI 프로젝트에 참여하면서 코딩 에이전트의 레포지토리 탐색 병목 문제를 집중적으로 파고들었으며, 이 공동 작업이 FastContext로 이어졌습니다. FastContext 논문과 모델 가중치는 2026년 6월 15일 arXiv(arXiv:2606.14066)와 HuggingFace에 동시 공개되었습니다.

업적

왕마오취안의 핵심 기여는 LLM 코딩 에이전트의 레포지토리 탐색 비용을 실증적으로 측정하고, 이를 해소할 서브에이전트 훈련 파이프라인을 설계한 것입니다. GPT-5.4 궤적 300개를 분석해 탐색 단계가 전체 도구 호출 턴의 56.2%, 총 토큰 소비의 46.5%를 차지한다는 진단을 제시했습니다. 이 실증 분석이 FastContext 설계의 동기를 뒷받침합니다.

FastContext는 레포지토리 탐색을 메인 에이전트에서 분리해 전용 서브에이전트에 위임하는 아키텍처를 채택합니다. 서브에이전트는 Read, Glob, Grep 등 읽기 전용 도구만 사용하며, 병렬 도구 호출을 통해 간결한 파일 경로와 라인 범위를 메인 에이전트에 돌려줍니다. 왕마오취안은 SWE-bench Multilingual, SWE-bench Pro, SWE-QA에 걸친 엔드투엔드 평가와 4B·30B 모델의 SFT+RL 훈련 파이프라인을 주도했습니다. FastContext-1.0 모델 가중치(4B-SFT, 4B-RL)는 Microsoft 공식 HuggingFace 저장소를 통해 공개되어 있습니다.

여담

FastContext 논문은 탐색 단계 비용이 생각보다 훨씬 크다는 점을 수치로 보여주면서, 서브에이전트 분리라는 아키텍처 방향을 실험으로 뒷받침했습니다. 레포지토리 탐색을 메인 에이전트에서 떼어내는 접근은 정확도와 비용 양쪽을 동시에 개선할 수 있다는 점에서, LLM 코딩 에이전트 연구의 실질적 전환점으로 평가받고 있습니다. Microsoft가 모델 가중치와 코드를 모두 공개 배포했다는 점도 주목할 만합니다.

주요 논문

FastContext: Training Efficient Repository Explorer for Coding Agents (arXiv:2606.14066, 2026) -- 장샤오치우와 공동 제1저자