장샤오치우

🏷️ 인물 에이전트 LLM

개요

장샤오치우(Shaoqiu Zhang)는 상하이교통대학교(SJTU) 소속 연구원으로, Microsoft CoreAI 프로젝트에 파견 참여하며 LLM 코딩 에이전트의 레포지토리 탐색 효율화 연구를 수행했습니다. 왕마오취안과 함께 FastContext 논문의 공동 제1저자를 맡았으며, 훈련 데이터셋 구성과 SFT 파이프라인 설계를 중심적으로 담당했습니다.

생애

장샤오치우는 상하이교통대학교 재학 중 Microsoft CoreAI와의 공동 연구 프로젝트에 참여하게 되었습니다. 이 파견 기간 동안 Microsoft Research의 왕마오취안과 함께 LLM 코딩 에이전트의 레포지토리 탐색 병목 문제를 연구했으며, 그 결과가 2026년 6월 arXiv에 공개된 FastContext 논문(arXiv:2606.14066)으로 이어졌습니다. SJTU는 중국 내에서 AI 및 컴퓨터과학 분야 상위권 대학으로, Microsoft를 포함한 글로벌 기업들과의 공동 연구 프로그램을 꾸준히 운영해 왔습니다.

업적

장샤오치우의 핵심 기여는 FastContext 모델 훈련을 위한 SFT(Supervised Fine-Tuning) 데이터셋 구성입니다. 총 2,954개의 훈련 샘플로 구성된 이 데이터셋은 세 가지 데이터 소스로 분리 설계되었습니다. parallel_toolcalls는 독립적인 파일 탐색을 병렬로 처리하는 능력을, multiturn_traj는 다턴 탐색 궤적 학습을, linerange는 정밀한 파일 내 라인 범위 특정 능력을 각각 가르치는 방식입니다. 이 분해 지도(decomposed supervision) 방식은 탐색 행동의 각 측면을 분리해서 훈련함으로써, 소수의 데이터로도 탐색 서브에이전트가 다양한 상황에 대응할 수 있도록 한 설계 아이디어입니다.

또한 참조 모델 궤적 수집 전 과정을 담당해, GPT-5.4를 활용한 300개의 탐색 궤적 수집과 분석에도 기여했습니다. 이 실증 분석이 탐색 단계가 전체 도구 호출 턴의 56.2%와 총 토큰 소비의 46.5%를 차지한다는 핵심 진단의 기반이 되었습니다.

여담

학부 또는 석사과정 연구원 신분으로 Microsoft CoreAI 규모의 프로젝트에 공동 제1저자로 참여하는 것은 드문 일입니다. FastContext 논문의 모델 가중치가 Microsoft 공식 HuggingFace 저장소를 통해 공개됐다는 점, 그리고 arXiv 논문 저자 소속에 SJTU와 Microsoft가 함께 명기됐다는 점은 이 협업의 성격을 잘 보여줍니다. 데이터셋 분해 설계라는 구체적 기여가 논문의 SFT 파이프라인 절에 명시되어 있어, 단순 참여가 아닌 실질적 설계 기여자임을 확인할 수 있습니다.

주요 논문