궈즈루이
개요
궈즈루이(Zirui Guo, 郭子睿)는 홍콩대학교(HKU) HKUDS Lab(Data Intelligence Lab)에서 황차오(Chao Huang) 교수의 지도를 받는 박사과정 연구자입니다. 그래프 기반 RAG(검색 증강 생성) 아키텍처를 전문으로 하며, LightRAG와 RAG-Anything의 1저자로 오픈소스 RAG 생태계에서 가장 주목받는 연구자 중 하나입니다.
Google Scholar 기준 2025년 누적 인용수 818회를 기록하고 있으며, EMNLP 2025 Findings에 논문이 채택됐습니다. LightRAG 리포지터리는 GitHub 스타 36,000개 이상, RAG-Anything 리포지터리는 14,500개 이상을 기록합니다.
HKUDS Lab은 황차오 교수가 이끄는 홍콩대학교 데이터 인텔리전스 연구실로, 추천 시스템, 지식 그래프, RAG 전반에 걸쳐 활발한 오픈소스 연구를 수행합니다.
생애
궈즈루이의 학부 과정 및 상세 생애에 대한 공개 정보는 제한적입니다. 홍콩대학교 HKUDS Lab에서 박사과정을 밟기 전 어떤 학교에서 학부를 마쳤는지는 공개된 프로필에 명시되어 있지 않습니다.
박사과정 지도교수 황차오는 HKUDS Lab을 이끌며 데이터 마이닝, 그래프 신경망, RAG 분야에서 다수의 영향력 있는 논문을 발표한 연구자입니다. 궈즈루이는 이 연구실에서 지식 그래프를 RAG에 통합하는 방향으로 연구를 집중해 왔습니다.
LightRAG 공저자로는 황차오 외에 Lianghao Xia, Yanhua Yu, Tu Ao가 있으며, RAG-Anything 공저자로는 Xubin Ren, Lingrui Xu, Jiahao Zhang, 황차오가 참여했습니다. 2026년 현재 LightRAG와 RAG-Anything은 통합 유지보수 형태로 GitHub에서 지속 업데이트되고 있으며, LightRAG에는 RAG-Anything의 멀티모달 파이프라인이 네이티브 통합됐습니다.
업적
궈즈루이의 대표 성과는 2024년 10월 공개한 LightRAG(arXiv:2410.05779)입니다. 기존 RAG가 청크 단위 텍스트를 단순 검색하던 방식을 넘어, 저수준 엔티티 검색과 고수준 개념 검색을 동시에 수행하는 듀얼 레벨 검색 체계를 지식 그래프 기반으로 구현했습니다. EMNLP 2025 Findings에 채택됐으며, 공개 직후 GitHub 스타 36,000개 이상을 기록하며 오픈소스 RAG 생태계의 기준점이 됐습니다. 마이크로소프트의 GraphRAG와 자주 비교되며, 더 가볍고 빠른 구현으로 주목받았습니다.
2025년 10월에는 LightRAG의 멀티모달 확장판 RAG-Anything(arXiv:2510.12323)을 공개했습니다. 텍스트 외에 이미지, 표, 수식, 코드를 모두 지식 그래프 노드로 표현하는 듀얼 그래프 구조를 도입했습니다. 비텍스트 콘텐츠 중심의 cross-modal knowledge graph와 텍스트 중심의 text-based knowledge graph를 각각 구축한 뒤 엔티티 정렬로 병합합니다. DocBench, MMLongBench 두 멀티모달 문서 QA 벤치마크에서 최신 기준선 대비 성능 향상을 보였으며, 특히 100페이지 이상 장문서에서 차이가 두드러졌습니다. 공개 직후 GitHub Trending 1위에 올랐습니다.
이 두 작업은 "단순 청크 검색 RAG의 한계를 지식 그래프로 극복한다"는 일관된 연구 방향 아래 진행됩니다. 텍스트에서 멀티모달로, 단일 그래프에서 듀얼 그래프로 순차적으로 확장한 궤적이 뚜렷하며, 2026년에는 두 프레임워크의 통합이 완성됐습니다.
여담
LightRAG는 2024년 하반기 오픈소스 커뮤니티에서 가장 빠르게 성장한 RAG 프레임워크 중 하나입니다. 기존 마이크로소프트의 GraphRAG와 자주 비교되며, 더 가볍고 빠른 구현으로 주목받았습니다. 리포지터리명이 "HKUDS/LightRAG"로 연구실 이름을 전면에 내세운 것도 특징입니다.
RAG-Anything의 GitHub 공개 직후 트렌딩 1위를 기록한 것은 멀티모달 RAG에 대한 커뮤니티의 높은 수요를 반영합니다. 논문 제목의 "All-in-One"이라는 표현처럼, 모달리티별로 파편화되어 있던 RAG 파이프라인을 단일 프레임워크로 통합하려는 시도가 실용적 관심을 끌었습니다.
2025년 기준으로 인용수 800건 이상은 박사과정 재학 중 기록으로는 상당히 높은 수치이며, LightRAG가 산업계 RAG 구현의 참조 코드로 광범위하게 사용되고 있음을 보여줍니다. PDF, 이미지, Office 문서, 표, 수식 등 다양한 포맷을 아우르는 통합 RAG 파이프라인은 2026년에도 실용적 수요가 높습니다.
주요 논문
- LightRAG: Simple and Fast Retrieval-Augmented Generation (EMNLP 2025 Findings, arXiv:2410.05779)
- RAG-Anything: All-in-One RAG Framework (arXiv:2510.12323, 2025)