Zhiqiang Shen

🏷️ 딥러닝 에이전트 LLM

Zhiqiang Shen은 아부다비에 위치한 모하메드 빈 자예드 인공지능 대학교(MBZUAI)의 머신러닝학과 조교수로, VILA Lab을 이끌고 있습니다. 푸단대학교와 UIUC(일리노이대 어바나-샴페인) 공동 과정에서 박사 학위를 받았고, 카네기멜론대학교 CyLab 박사후 연구원 및 홍콩과기대(HKUST) 조교수 겸 IAS Junior Fellow를 거쳐 2022년부터 MBZUAI에 자리를 잡았습니다.

연구 핵심은 효율적인 딥러닝입니다. 지식 증류, 파라미터 효율 파인튜닝, 데이터셋 증류, 이진 신경망(BNN) 최적화 등을 다루며 CVPR, ECCV, ICCV, ICLR, NeurIPS, ICML 등 주요 학회에 지속적으로 1저자 및 교신저자 논문을 게재했습니다. 피인용 횟수는 1만 2천 회에 달하며, 대표 논문으로는 레이블 스무딩과 지식 증류의 관계를 재정립한 "Is Label Smoothing Truly Incompatible with Knowledge Distillation" (ICLR 2021), 빠른 시각 인식 증류 프레임워크 "A Fast Knowledge Distillation Framework for Visual Recognition" (ECCV 2022), 객체 탐지를 위한 데이터셋 증류 "OD3" (ICLR 2026) 등이 있습니다.

2026년 4월에는 VILA Lab 학생들과 함께 Anthropic의 Claude Code TypeScript 소스(v2.1.88)를 직접 분석한 "Dive into Claude Code" 리포트를 arXiv에 공개했습니다. 단순 사용 후기가 아니라 코드 줄번호까지 짚으며 에이전트 시스템의 5개 가치, 13개 설계 원칙, 7개 컴포넌트를 정리한 아키텍처 분석으로, X(트위터)와 HuggingFace Papers에서 빠르게 확산됐습니다. 핵심 발견인 "코드베이스의 98.4%가 운영 인프라"라는 문구는 에이전트 설계 철학을 한 줄로 압축한 것으로 광범위하게 인용됐습니다.