2026. 04. 이달의 인물 - Zhiqiang Shen
4월의 AI 연구 지형을 돌아보면, 모델 자체보다 그 모델을 둘러싼 시스템에 대한 관심이 두드러졌습니다. Claude Code 아키텍처 분석이 X(트위터)를 달군 것도, 재귀적 멀티에이전트 구조에 대한 글이 호응을 얻은 것도 같은 맥락입니다. 단일 모델의 지능보다 에이전트 하네스가 실제 성능을 좌우한다는 인식이 넓어지는 한 달이었습니다.
Zhiqiang Shen
Zhiqiang Shen은 아부다비 모하메드 빈 자예드 인공지능 대학교(MBZUAI) 머신러닝학과 조교수이자 VILA Lab 공동 운영자입니다. 푸단대학교와 UIUC 공동 박사 과정을 마친 뒤 카네기멜론대 CyLab 박사후 연구원, 홍콩과기대 조교수를 거쳐 2022년부터 MBZUAI에 자리를 잡았습니다. 효율적 딥러닝과 지식 증류를 중심으로 CVPR, ECCV, ICLR, NeurIPS 등 주요 학회에 꾸준히 논문을 내온 연구자입니다. 2026년 4월, 그의 팀이 Anthropic의 Claude Code 소스를 직접 뜯어본 리포트를 arXiv에 올리면서 이름이 널리 알려졌습니다.
Dive into Claude Code The Design Space of AI Agent Systems
Claude Code의 TypeScript 소스(v2.1.88)를 파일과 줄번호까지 짚어가며 분석한 논문입니다. MBZUAI VILA Lab과 UCL 공동 연구로, Anthropic이 오픈소스로 공개해 둔 코드베이스 전체를 체계적으로 해부했습니다.
가장 많이 회자된 발견은 비율입니다. 코드베이스 전체에서 AI 의사결정 로직은 약 1.6%에 불과하고, 나머지 98.4%는 권한 관리, 컨텍스트 압축, 세션 유지, 서브에이전트 조율 같은 운영 인프라입니다. 모델이 에이전트의 본체가 아니라 그 둘레를 감싸는 하네스가 실제 작동을 결정한다는 뜻입니다.
논문은 이 구조를 5개 인간 가치, 13개 설계 원칙, 7개 컴포넌트, 5개 서브시스템 레이어, 7중 안전 레이어로 정리합니다. 예를 들어 권한 시스템은 사용자가 명시적으로 허용한 작업 범위를 세션 단위로 추적하고, 컨텍스트 압축은 긴 대화를 모델 입력으로 넘기기 전에 자동으로 요약합니다. 서브에이전트는 복잡한 태스크를 병렬로 분기시키되 각 분기의 출력을 상위 에이전트가 합성하는 계층 구조를 따릅니다.
이 논문이 흥미로운 이유는 "에이전트 설계"라는 막연한 개념을 실제 프로덕션 코드 기반으로 설명한다는 점입니다. 기존 에이전트 연구 대부분은 논문 단위의 프로토타입을 다뤘지만, 이 리포트는 수백만 명이 실제로 사용 중인 시스템의 코드를 근거로 삼습니다. "어떻게 하면 에이전트가 안전하고 확장 가능하게 작동하는가"라는 질문에 가장 직접적인 참고 자료가 됐습니다.
선정 이유
Zhiqiang Shen의 커리어는 효율을 중심에 놓고 있습니다. 지식 증류로 큰 모델을 작은 모델에 옮겨 담고, 데이터셋을 압축해 학습 비용을 줄이고, 파라미터 효율 파인튜닝으로 적은 자원으로 더 많은 것을 하는 방법을 연구해 왔습니다. 그 맥락에서 에이전트 시스템의 인프라 구조를 분석하는 작업은 자연스러운 확장입니다. 모델 바깥의 시스템을 어떻게 설계해야 하는가 역시 효율과 안전성의 문제이기 때문입니다.
4월에 이 논문이 갖는 의미는 단순히 클로드 코드를 해부했다는 데 그치지 않습니다. 에이전트가 어떤 인프라 위에서 작동해야 하는지를 공개된 프로덕션 코드로 보여줌으로써, 이후 에이전트 시스템 설계 논의의 기준점을 만들었습니다. X 스레드와 HuggingFace Papers에서 빠르게 확산된 것도 같은 이유입니다. 이 달, 에이전트를 진지하게 다루는 커뮤니티에서 가장 많이 읽힌 리포트 중 하나였습니다.
4월은 화려한 신모델 발표보다 "그 모델을 어떻게 쓸 것인가"에 더 많은 에너지가 모인 달이었습니다. Zhiqiang Shen의 분석은 그 질문에 가장 구체적인 답을 내놓은 작업이었고, 그것이 이달의 선정 이유입니다.