장웨이난

개요

장웨이난(Weinan Zhang)은 상하이교통대학교(SJTU) 컴퓨터과학부 교수이자 박사 지도교수, 학부장 보좌역입니다. 강화학습, 에이전트 AI, 임바디드 AI, 로봇 학습을 주요 연구 영역으로 삼고 있으며, ICML·NeurIPS·ICLR·KDD의 에어리어 체어와 TPAMI 부편집장을 역임해 왔습니다. 구글 스칼라 기준 피인용 수는 3만 회를 상회하며, 주요 국제 컨퍼런스와 워크숍에서 200편이 넘는 논문을 발표했습니다.

생애

장웨이난은 상하이교통대학교 ACM 명예반 출신으로 학부를 마치고 2011년 학사학위를 취득했습니다. 이후 유니버시티 칼리지 런던(UCL) 컴퓨터과학부에서 박사과정을 밟아 2016년 박사학위를 취득했습니다. 박사 졸업 직후 SJTU 컴퓨터과학부 교수로 부임해 현재까지 재직 중입니다.

수상 이력으로는 ACM 라이징 스타 어워드(2017)와 알리바바 다모 영 스칼라 어워드(2018)가 있으며, 국제 컨퍼런스와 워크숍에서 다섯 번의 최우수 논문상을 수상했습니다. 강화학습과 에이전트 AI에 대한 깊은 축적을 바탕으로, 최근에는 에이전트형 웹(Agentic Web), LLM 에이전트 강화학습, 로봇 학습으로 연구 스펙트럼을 넓히고 있습니다.

업적

장웨이난의 연구는 크게 세 방향으로 나뉩니다. 첫째는 심층 강화학습의 이론과 응용으로, 게임 AI부터 추천 시스템, 금융 거래까지 다양한 도메인에 RL을 적용한 선구적 연구들이 포함됩니다. 둘째는 에이전트 AI 전반으로, LLM 기반 에이전트의 자율적 계획·추론·도구 활용 능력과 그 최적화 방법론을 다룹니다. 2025년에는 "A Survey of LLM-based Deep Search Agents"를 공동 저술하며 LLM 에이전트 검색 패러다임을 종합 정리했습니다.

셋째는 자기진화 LLM 에이전트의 위험성 연구입니다. ICLR 2026에 게재된 "Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents" 논문에서 자기진화 에이전트가 의도치 않은 방향으로 발전할 수 있는 창발적 위험을 분석했습니다. Autoregressive Diffusion World Models for Off-Policy Evaluation of LLM Agents 논문에서는 공저자로 참여해, LLM 에이전트의 오프폴리시 평가를 자동회귀 디퓨전 월드 모델로 풀어내는 연구에 이론적 기반을 제공했습니다.

여담

장웨이난은 2025년 런던에서 열린 DAI 2025와 2026년 싱가포르에서 열리는 AAAI 2026에서 에이전트 AI 주제의 튜토리얼과 워크숍을 주최합니다. 대학원 지도 방침으로는 에이전트 AI, 에이전트 웹, 심층 강화학습, 로봇 학습 분야에서 뛰어난 동기를 가진 박사과정생을 지속적으로 모집하고 있다고 밝히고 있습니다. SJTU 내에서 슝궈쥔 등과 함께 에이전트 연구 그룹을 이루고 있으며, 에모리대의 탕성푸·류카이쉬안 등 해외 연구자와도 활발하게 협업하고 있습니다.

주요 논문

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents (ICLR 2026)
A Survey of LLM-based Deep Search Agents: Paradigm, Optimization, Evaluation, and Challenges (2025)
Autoregressive Diffusion World Models for Off-Policy Evaluation of LLM Agents -- 공저
Rethinking Agentic Reinforcement Learning in Large Language Models (arXiv:2604.27859, 2026) -- 공저
The Landscape of Agentic Reinforcement Learning for LLMs: A Survey (arXiv:2509.02547, 2025) -- 관련 서베이