그레이엄 뉴비그
개요
그레이엄 뉴비그(Graham Neubig)는 카네기멜런대학교(CMU) 언어기술연구소(LTI) 부교수이자 NeuLab의 리더입니다. 자연어처리 전반, 특히 다국어 NLP, 자연어 인터페이스, NLP 시스템 구축과 평가를 위한 머신러닝 방법론이 주된 연구 영역입니다. "세계의 모든 사람이 자신의 언어로 서로, 그리고 컴퓨터와 소통할 수 있도록 만드는 것"을 연구의 궁극적 목표로 밝힌 바 있습니다.
논문과 강의 자료, 오픈소스 코드를 적극적으로 공개해 NLP 연구의 접근성을 높이는 데 기여해왔습니다. NeuLab GitHub 계정에는 60개 이상의 공개 저장소가 있으며, nn4nlp 강의 자료는 전 세계 NLP 입문자들이 즐겨 찾는 교재 중 하나입니다.
산업계 활동으로는 LLM 평가 도구 회사 Inspired Cognition의 CEO를 거쳐, 2024년에는 자율 소프트웨어 엔지니어링 에이전트 OpenHands를 개발하는 All Hands AI를 Robert Brennan, Xingyao Wang과 공동창업하고 수석 과학자로 합류했습니다.
생애
미국 일리노이대학교 어바나-샴페인(UIUC)에서 컴퓨터과학 학사 학위를 받았습니다. 이후 일본으로 건너가 나라첨단과학기술대학원대학(NAIST)에서 박사 학위를 취득했으며, 이 시기 교육자 및 국제교류 코디네이터로도 활동했습니다. 일본어를 강의와 인터뷰에서 소화할 만큼 능숙하게 구사하게 된 것도 이 시기의 경험 덕분입니다.
박사 학위 취득 후 교토대학교에서 인턴십을 거쳐 CMU LTI 교수로 부임했으며, 현재까지 재직 중입니다. 일본, 한국 출신 연구자들과의 멘토링 네트워크가 두터운 편으로, 한국 출신 연구자들이 CMU에서 NLP를 연구하는 중요한 관문 역할을 해왔습니다.
2024년에는 CMU 교수직을 유지하면서 All Hands AI를 공동창업하고, OpenHands(구 OpenDevin) 프로젝트를 오픈소스로 공개했습니다. OpenHands는 MIT 라이선스 기반의 커뮤니티 프로젝트로 188명 이상의 기여자, 2,100회 이상의 커밋이 쌓였습니다. 2026년 현재 AI 소프트웨어 엔지니어링 에이전트 플랫폼의 핵심 오픈소스 인프라로 자리잡고 있습니다.
업적
NLP 연구에서 뉴비그의 가장 두드러진 기여는 다국어 처리와 에이전트 코딩 분야입니다. 다국어 NLP 쪽에서는 영어 중심 모델의 한계를 지적하고, 저자원 언어와 비영어권 언어를 위한 평가 방법론과 학습 기법을 꾸준히 연구해왔습니다. XTREME, XTREME-R 같은 다국어 평가 벤치마크는 이 분야 연구의 중요한 인프라가 되었습니다.
에이전트 연구에서는 OpenHands 플랫폼을 통해 AI 소프트웨어 엔지니어가 코드 작성, 명령줄 조작, 웹 브라우징을 인간 개발자처럼 수행할 수 있도록 하는 오픈 플랫폼을 구축했습니다. OpenHands는 ICLR 2025에서 정식 채택되었으며, 자율 코딩 에이전트 연구의 중요한 벤치마크이자 인프라로 자리잡았습니다.
2026년에는 손귀진, 김승원, 캐서린 아넷, 아카리 아사이 등과 함께 연구 수준 수학 벤치마크 SOOHAK의 공동저자로 참여했습니다. 국내 한국어 평가 연구 네트워크와 CMU가 한 프로젝트에서 만나는 데 매개 역할을 한 사례입니다. 2025년 3월에는 OpenHands 1주년 블로그 글을 직접 발행하며 오픈소스 AI 개발의 여정을 공개적으로 돌아봤습니다.
여담
일본 체류 경험은 뉴비그의 연구 방향과 개인 스타일 모두에 뚜렷한 흔적을 남겼습니다. 일본어 관련 데이터셋과 NLP 도구 공개에도 적극적이며, 연구 자료를 논문 발표와 동시에 GitHub에 공개하는 것을 기본 원칙으로 삼고 있습니다.
2024년 MLOps Community에서 "에이전트의 프로덕션 배포"를 주제로 강연했고, 2025년에는 MLOps World에서 "소프트웨어 개발 에이전트의 최신 현황"을 발표했습니다. 자율 에이전트 연구를 단순한 학문적 탐구가 아니라 실제 소프트웨어 엔지니어링 현장의 문제 해결로 연결하려는 실용적 관점을 꾸준히 피력하고 있습니다.
All Hands AI는 Madrona Venture Group으로부터 투자를 유치하며 AI 에이전트 인프라 회사로서 본격적인 성장 국면에 들어서고 있습니다. OpenHands를 기반으로 한 멀티모달 브라우징 에이전트 연구도 2026년에 arXiv에 공개되는 등 플랫폼 위에서 후속 연구가 활발히 이어지고 있습니다.
주요 논문
- XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalisation (2020) -- 40개 언어, 9개 과제를 망라한 다국어 평가 벤치마크
- XTREME-R: Towards More Challenging and Nuanced Multilingual Evaluation (2021) -- XTREME 확장판, 더 어렵고 세밀한 다국어 평가 설계
- DyNet: The Dynamic Neural Network Toolkit (2017) -- 동적 연산 그래프 기반 딥러닝 프레임워크
- A Syntactic Neural Model for General-Purpose Code Generation (2017) -- 구문 구조를 활용한 코드 생성 신경망 모델
- Incorporating External Knowledge through Pre-training for Natural Language to Code Generation (2020) -- StackOverflow, API 문서를 사전학습에 통합한 NL-to-code 생성
- MCoNaLa: A Benchmark for Code Generation from Multiple Natural Languages (2022) -- 다국어 자연어로부터의 코드 생성 벤치마크
- Rapid Adaptation of Neural Machine Translation to New Languages (2018) -- 새 언어에 빠르게 적응하는 신경 기계 번역 방법론
- Learning to Mine Aligned Code and Natural Language Pairs from Stack Overflow (2018) -- Stack Overflow에서 코드-자연어 쌍을 자동 수집하는 방법
- A Systematic Evaluation of Large Language Models of Code (2022) -- 다국어 코드 LLM 평가 프레임워크 MBXP, Multilingual HumanEval 제안
- Efficient Nearest Neighbor Language Models (2021) -- kNN 검색 기반 효율적 언어 모델
- OpenHands: An Open Platform for AI Software Developers as Generalist Agents (2024) -- 코드 작성, CLI, 웹 브라우징을 수행하는 오픈소스 AI 소프트웨어 에이전트 플랫폼 (ICLR 2025)