알렉스 장

🏷️ 인물 LLM 머신러닝

개요

알렉스 장(Alex L. Zhang)은 MIT CSAIL 박사과정 학생으로, Recursive Language Models(RLM) 논문의 1저자입니다. 오마르 카탑(Omar Khattab)과 팀 크라스카(Tim Kraska)의 공동 지도를 받으며, "언어모델이 충분히 활용되지 못하거나 비효율적으로 쓰이는 영역"을 주된 연구 대상으로 삼습니다.

프린스턴 컴퓨터과학과를 수석으로 졸업한 뒤 MIT에 진학했으며, 학부 시절 Karthik Narasimhan, Khanh Nguyen, Ofir Press, Kai Li 등 여러 연구자의 지도를 받은 바 있습니다. 자신의 연구 블로그(alexzhang13.github.io)를 통해 아이디어를 먼저 공개하고 커뮤니티 반응을 확인한 뒤 정식 논문으로 발전시키는 방식을 즐겨 씁니다.

생애

프린스턴대학교에서 컴퓨터과학 학사를 최우수 성적으로 마쳤습니다. 재학 중 Karthik Narasimhan, Khanh Nguyen, Ofir Press, Kai Li의 지도 아래 NLP와 언어모델 연구를 접했습니다. 학부 졸업 후 MIT CSAIL에 진학해 데이터 시스템과 언어모델의 교차점을 연구하는 그룹에 합류했습니다.

MIT에서는 오마르 카탑팀 크라스카의 공동 지도를 받습니다. 카탑은 DSPy 등 LLM 파이프라인 최적화 연구로, 크라스카는 learned index와 데이터베이스·ML 교차 연구로 잘 알려진 인물입니다. 두 지도교수의 배경이 맞물려, 알렉스 장의 연구도 LLM의 추론 효율성과 시스템적 설계를 동시에 다루는 방향으로 수렴하고 있습니다.

RLM 논문은 2025년 12월 arXiv에 최초 제출(arXiv:2512.24601)되었고, 2026년 5월 최신 버전이 공개되었습니다.

업적

핵심 기여는 Recursive Language Models(RLM) 프레임워크입니다. 기존 LLM은 긴 프롬프트를 어텐션 윈도우에 통째로 밀어 넣는 방식을 씁니다. 프롬프트가 길어질수록 품질이 급락하는 "context rot" 현상이 발생하는데, RLM은 이를 근본적으로 다른 방식으로 해결합니다. 긴 입력을 외부 환경의 변수로 취급하고, 모델이 코드를 작성해 해당 변수를 들여다보거나 자기 자신을 재귀 호출하도록 만드는 것입니다.

논문에서는 GPT-5, Qwen3-Coder 같은 프런티어 모델로 평가를 진행했고, 8B 모델을 1,000개 샘플만으로 직접 파인튜닝해 RLM-Qwen3-8B를 만들었습니다. 이 모델은 평균 28.3% 성능 향상을 보였습니다. 구현체와 학습 레시피, 트라젝토리 데이터까지 GitHub(github.com/alexzhang13/rlm)에 공개했습니다.

RLM 아이디어는 본인 블로그 게시물이 출발점입니다. 독자 반응이 좋자 프런티어 모델 평가와 8B 파인튜닝을 추가해 정식 논문으로 키웠습니다. 이렇게 블로그 아이디어에서 시작해 정식 논문으로 발전시키는 과정이 그의 연구 스타일을 잘 보여줍니다.

RLM은 표준 컨텍스트 윈도우보다 두 자릿수 이상 긴 입력도 처리할 수 있음을 보였으며, 짧은 프롬프트에서도 vanilla LLM보다 품질이 높다는 결과를 제시합니다.

여담

자신의 웹사이트와 GitHub를 적극 활용하는 "공개 연구(open research)" 스타일로 알려져 있습니다. RLM 논문 이전에도 블로그에서 아이디어를 먼저 공유하고 커뮤니티 피드백을 반영해 연구를 발전시켜 왔습니다.

박사과정임에도 단독으로 이론 증명(부록 포함), 실험 설계, 구현, 평가까지 한 트랙으로 묶어 처리하는 집중력이 주목받습니다. 지도교수 카탑의 DSPy 계열 연구와 크라스카의 시스템 연구가 교차하는 지점에서 고유한 문제 의식을 끌어낸다는 평가도 있습니다.

2026년 RLM 후속 연구로 람다 대수(lambda calculus)를 LLM에 도입하는 "Y-Combinator for LLMs" 방향의 연구(arXiv:2603.20105)도 공동 저술한 것으로 확인됩니다.

주요 논문