황차오
개요
Chao Huang(황차오, 黄超)은 홍콩대학교(HKU) 컴퓨터 과학과 테뉴어 트랙 조교수이자 Musketeers Foundation Institute of Data Science 소속 연구자입니다. 그래프 신경망, 추천 시스템, 검색 증강 생성(RAG) 분야를 연구하며, LLM과 그래프 구조를 결합하는 오픈소스 프레임워크 개발로 전 세계 AI 커뮤니티에서 주목받고 있습니다.
황차오가 이끄는 Data Intelligence Lab @ HKU(HKUDS)는 LightRAG, RAG-Anything, GraphGPT, UrbanGPT 등 복수의 오픈소스 프로젝트를 연달아 공개하며 학계와 산업계 양쪽에서 존재감을 키워 왔습니다. 2025년 기준 HKUDS 랩의 GitHub 누적 스타는 7만 7000개를 넘으며, GitHub Trending에 59회 진입한 기록을 보유합니다. 단일 학술 연구 그룹으로는 GitHub 글로벌 Top-200 수준에 해당하는 수치입니다.
국제 학술 무대에서도 KDD, WWW, SIGIR, IJCAI, AAAI, WSDM 등 주요 컨퍼런스에 꾸준히 논문을 발표하고 있으며, Google Scholar 기준 1만 4000회 이상의 피인용 수를 기록하고 있습니다.
생애
황차오는 미국 노트르담 대학교(University of Notre Dame)에서 그래프 신경망과 추천 시스템을 주제로 박사 학위를 취득했습니다. 통계 모델과 그래프 이론을 결합한 협업 필터링 연구에서 박사 논문의 기반을 닦았으며, 이 시기에 쌓은 그래프 기반 인코딩 방법론은 이후 연구 전반에 걸쳐 활용됩니다.
박사 졸업 후에는 미국 실리콘밸리의 JD Research America에서 리서치 사이언티스트로 근무하며 산업 현장의 대규모 추천 시스템 문제를 다루었습니다. 이후 홍콩대학교 컴퓨터 과학과 테뉴어 트랙 조교수로 임용되었고, Musketeers Foundation Institute of Data Science를 겸직 소속으로 두게 되었습니다. 홍콩대학교 부임 이후 HKUDS 랩을 설립하고, 그래프 기반 지능 시스템과 LLM을 연결하는 연구를 본격화했습니다.
2022년부터 Stanford Top 2% Scientists에 연속 선정되었으며, 2025년에는 AI 100 Young Pioneers Award를 수상하여 학계에서의 위상을 공식적으로 인정받았습니다.
업적
황차오의 대표 성과는 2024년 공개한 LightRAG입니다. 단순한 청크 단위 검색을 넘어, 그래프 기반 듀얼 레벨 검색(저수준 엔티티 검색 + 고수준 개념 검색)을 RAG에 통합한 프레임워크입니다. NaiveRAG, RQ-RAG, HyDE, GraphRAG 등 기존 방법 대비 농업, 컴퓨터 과학, 법률, 혼합 도메인 전반에서 일관되게 우수한 성능을 보였습니다. 공개 직후 GitHub 스타 3만 6000개 이상을 받으며 오픈소스 RAG 생태계의 주요 기준점 중 하나가 되었고, EMNLP 2025 Findings에 채택되었습니다.
같은 해 SIGIR 2024에서 발표한 GraphGPT는 LLM을 그래프 데이터에 맞게 인스트럭션 튜닝하는 첫 시도로 평가받습니다. KDD 2024에서 발표한 UrbanGPT는 LLM을 교통, 범죄 등 도시 시공간 예측 문제에 적용한 연구입니다. 두 논문 모두 LLM의 적용 범위를 전통적인 텍스트 처리 너머로 확장했다는 점에서 의미를 갖습니다.
2025년 10월 공개한 RAG-Anything(arXiv:2510.12323)은 텍스트뿐 아니라 이미지, 표, 수식, 코드를 모두 노드로 처리하는 통합 멀티모달 지식 그래프를 구성해, 문서 내 모달 간 관계를 유지한 채 검색하는 프레임워크입니다. LightRAG의 멀티모달 확장판으로 볼 수 있으며, 공개 직후 GitHub Trending 1위에 올랐습니다. 2026년 5월에는 RAG-Anything이 LightRAG에 통합되어 단일 프레임워크에서 멀티모달 RAG가 가능해졌으며, 2026년 3월에는 LightRAG에 도커 기반 로컬 배포 설정 마법사(setup wizard)가 추가되며 기업 환경에서의 사용성이 한층 강화되었습니다.
여담
황차오의 연구 스타일은 논문 발표와 오픈소스 공개를 거의 동시에 진행하는 것으로 알려져 있습니다. 학술 커뮤니티보다 실용 커뮤니티가 먼저 반응하는 경우도 많아, GitHub Trending 진입이 논문 인용보다 빠른 경우도 있습니다. LightRAG나 RAG-Anything처럼 코드만 보고도 즉시 실험할 수 있는 형태로 공개된 덕분입니다.
RAG-Anything의 경우 X(구 트위터)를 통해 황차오 본인이 직접 발표를 알리는 방식을 택했으며, 이를 보고 하루 만에 수천 명이 GitHub 저장소를 방문하는 반응이 나타났습니다. 오픈소스 연구자로서 커뮤니케이션과 배포 방식에도 전략적인 면이 있다는 평가를 받습니다.
HKUDS 랩 전체를 기준으로 보면 GitHub 글로벌 Top-200 수준의 스타 수를 기록하고 있는데, 단일 연구자 그룹이 이 정도 수치를 쌓는 것은 드문 일입니다. 황차오 스스로도 랩의 오픈소스 철학을 강조하며, 연구 결과를 논문 속에만 가두지 않는 방식으로 커뮤니티와 협력하는 태도를 유지하고 있습니다.
주요 논문
- Knowledge-aware Coupled Graph Neural Network for Social Recommendation (2021, AAAI) -- 지식 그래프와 소셜 관계를 결합한 추천 시스템
- Graph Meta Network for Multi-Behavior Recommendation (2021, SIGIR) -- 다양한 사용자 행동 패턴을 메타 학습으로 모델링
- Multi-Behavior Sequential Recommendation with Temporal Graph Transformer (2022) -- 시간 그래프 트랜스포머를 활용한 다중 행동 순차 추천
- Hypergraph Contrastive Collaborative Filtering (2022, SIGIR) -- 하이퍼그래프 대조 학습 기반 협업 필터링
- Self-Supervised Hypergraph Transformer for Recommender Systems (2022, KDD) -- 자기 지도 하이퍼그래프 트랜스포머 추천 모델
- Spatial-Temporal Graph Learning with Adversarial Contrastive Adaptation (2023, ICML) -- 적대적 대조 적응을 활용한 시공간 그래프 학습
- GPT-ST: Generative Pre-Training of Spatio-Temporal Graph Neural Networks (2023, NeurIPS) -- 시공간 GNN의 생성형 사전 학습
- GraphGPT: Graph Instruction Tuning for Large Language Models (2024, SIGIR) -- LLM을 그래프 데이터에 맞게 인스트럭션 튜닝한 첫 시도
- UrbanGPT: Spatio-Temporal Large Language Models (2024, KDD) -- LLM을 도시 시공간 예측 문제에 적용
- LightRAG: Simple and Fast Retrieval-Augmented Generation (2024, EMNLP Findings) -- 그래프 기반 듀얼 레벨 검색을 RAG에 통합, GitHub 스타 3만 6000+
- RAG-Anything: All-in-One RAG Framework (2025) -- 텍스트·이미지·표·수식·코드를 통합 처리하는 멀티모달 지식 그래프 RAG