리원제

개요

리원제(李文杰, Wenjie Li)는 홍콩 이공대학교(PolyU) 컴퓨터학과 교수이자 PolyU NLP 연구 그룹 리더입니다. 자동 요약, 자연어 이해와 생성, 질의응답, 대화 시스템을 핵심 연구 영역으로 다룹니다. H-Index 52, 누적 인용 21,000회 이상을 기록한 시니어 연구자입니다.

최근에는 LLM 추론 효율화, speculative decoding, 멀티모달 대화 QA로 연구를 확장하고 있습니다. 홍콩 연구보조금위원회(RGC)와 중국 국가자연과학기금(NSFC)으로부터 다수의 연구 과제를 수주해 실질적인 연구 역량을 갖추고 있습니다.

2026년에는 ICML, IJCAI, SIGIR, ACL 등 최상위 학회에 다수의 논문이 게재 확정되며 연구 생산성의 정점을 이어가고 있습니다. speculative decoding과 test-time scaling이 LLM 효율화의 핵심 방법론으로 부상하는 흐름에서, 이 분야에서 가장 체계적인 연구를 이어가는 그룹 중 하나로 자리잡고 있습니다.

생애

중국 출신으로 박사 학위를 취득한 뒤 홍콩 이공대학교 컴퓨터학과에 합류했습니다. 현재까지 장기 재직하며 PolyU NLP 그룹을 구축하고 이끌어 왔습니다. 약 200편의 주요 학술지 및 학술대회 논문을 발표했으며, IEEE TKDE, IEEE TNN, ACM TOIS 등의 저널과 ACL, EMNLP, AAAI, COLING, SIGIR 등의 학술대회에 꾸준히 게재해 왔습니다.

PolyU에서 Faculty of Engineering Research Grant Achievement Award 2023(공동 수상)을 받았습니다. 현재 PolyU NLP 그룹에서 다수의 박사과정생을 지도하며 speculative decoding, 시험시간 스케일링(test-time scaling), 인과 추론(causality mining) 등 다양한 주제를 함께 연구하고 있습니다.

2025년에는 COLING에서 speculative decoding 튜토리얼을 진행하며 학술 커뮤니티에 이 분야의 방법론을 체계적으로 정리해 공유하기도 했습니다. 이 튜토리얼은 ACL 2024에 발표된 포괄적 서베이 논문과 함께, 리원제 연구실이 speculative decoding 분야의 학술 커뮤니티 형성에 기여하는 중요한 통로가 되었습니다.

업적

리원제의 연구는 텍스트 요약 분야에서 쿼리 중심 다중 문서 요약, 대화 회의록 요약 등 실용적인 문제에 일관되게 집중해왔습니다. 감정 기반 대화 생성, 목표 지향 대화 추천, 멀티모달 대화 QA 등으로 연구 범위를 점진적으로 넓혀왔습니다.

2024년 이후 연구실은 LLM 추론 효율화에 역량을 집중하고 있습니다. 박사과정생 헤밍 샤(Heming Xia)의 speculative decoding 서베이(ACL 2024)와 TokenSkip(EMNLP 2025), Fuzzy Speculative Decoding(2025) 등이 대표 결과물입니다. 이 연구들은 LLM 추론 속도를 높이면서도 출력 품질을 유지하는 방법론적 토대를 제공합니다. PACER(ICASSP 2026 예정)는 적응형 길이를 활용한 블록 단위 사전 검증으로 speculative decoding을 더욱 정교화한 후속 연구입니다.

2026년에는 수학적 시험시간 스케일링의 자원 배분을 다루는 SCALE 연구를 AAAI 2026에 발표했고, 개인화된 LLM 정렬을 위한 Meta Reward Modeling 연구가 SIGIR 2026에 게재되었습니다. Optical Reasoning via Multimodal Chain-of-Thought 관련 연구에서는 텍스트 대신 이미지를 추론 매체로 활용하는 아이디어를 교신 저자로 주도했습니다.

여담

리원제 연구실의 특징은 기초 연구와 응용 사이의 균형입니다. 중국어 자연어 처리 교과서 공동 집필, 중국어 의미 분석 도구 개발 등 학술 커뮤니티에 구체적인 결과물을 제공해온 이력이 있습니다.

대화 시스템에서 감정을 다루는 연구(Emotion-Driven Conversation)는 단순한 QA 정확도를 넘어 사용자 경험의 질을 높이려는 방향성을 보여줍니다. 이는 기술적 성능 지표와 실제 사용자 가치 사이의 간극을 의식하는 연구 태도와 연결됩니다.

speculative decoding처럼 LLM 추론 경량화가 주목받기 시작한 시기에 이 분야로 자연스럽게 연구를 확장한 점도 눈에 띕니다. 거대 모델의 성능 향상만큼이나 실제 배포 효율화에 대한 수요가 커진 흐름을 잘 읽은 결과입니다. 서베이 논문 출판과 COLING 튜토리얼 진행을 병행하는 방식은 연구 결과를 커뮤니티로 빠르게 확산시키는 전략이기도 합니다.

주요 논문

Conversational Question Answering over Text, Tables, and Images (ACL 2022)
Causality Reasoning for Empathetic Response Generation (EMNLP 2022)
Few-shot Query-Focused Summarization with Prefix-Merging (EMNLP 2022)
Multi-turn Emotional Support Dialogue Generation (EMNLP 2022)
Unlocking Efficiency in Large Language Model Inference: A Comprehensive Survey of Speculative Decoding (ACL 2024)
Dialogue Acts Enhanced Extract-Abstract Framework for Meeting Summarization (Information Processing and Management)
TokenSkip: Controllable Chain-of-Thought Compression in LLMs (EMNLP 2025)
SCALE: Selective Resource Allocation for Overcoming Performance Bottlenecks in Mathematical Test-time Scaling (AAAI 2026)
One Adapts to Any: Meta Reward Modeling for Personalized LLM Alignment (SIGIR 2026)
Optical Reasoning via Multimodal Chain-of-Thought