천카이펑

개요

천카이펑(陈凯峰, Kaifeng Chen)은 중국 톈진대학교(Tianjin University) 소속 연구자로, 멀티모달 긴 문서 질의응답(Multimodal Long Document QA)과 에이전트 메모리 구조를 전문으로 연구합니다. 긴 문서를 처리할 때 맥락이 희석되거나 핵심 증거가 묻히는 문제를 다중 에이전트와 구조화된 메모리의 결합으로 해결하려는 방향에 집중하고 있습니다.

교신저자인 펑치야오와 같은 톈진대학교 소속으로, 산업 파트너인 치푸 테크놀로지(Qifu Technology)와도 협력 연구를 진행합니다.

생애

천카이펑의 세부 학력 및 초기 경력에 대한 공개 정보는 제한적입니다. 톈진대학교에서 멀티모달 QA와 에이전트 메모리 연구를 이어가며, 대학과 산업 기관이 공동 참여하는 연구 프로젝트에 주로 기여하고 있습니다. MARDoc 논문에는 톈진대학교 외에도 베이항대학교(Beihang University), 장난대학교(Jiangnan University), 치푸 테크놀로지 등 복수 기관이 참여했습니다.

2026년 6월 arXiv에 공개된 MARDoc 논문(arXiv:2606.05749)이 현재까지 가장 주목받는 연구 성과입니다. 발표 직후 멀티모달 문서 처리 연구 커뮤니티에서 관심을 끌었습니다.

업적

천카이펑의 핵심 연구는 MARDoc - A Memory-Aware Refinement Agent Framework for Multimodal Long Document QA(arXiv:2606.05749, 2026)로, 이 논문의 제1저자입니다.

MARDoc이 해결하고자 하는 문제는 명확합니다. 기존 긴 문서 QA 시스템은 검색 궤적, 관찰 내용, 중간 추론 결과를 하나의 거대한 맥락 스트림에 계속 쌓아갑니다. 문서가 길어질수록 핵심 증거가 노이즈 속에 희석되고, 멀티홉 추론에서 오류가 누적됩니다.

MARDoc은 이 문제를 세 에이전트의 분업으로 풀어냅니다. 탐색 에이전트(Explorer)는 다중 세분성 멀티모달 검색을 담당하고, 정제 에이전트(Refiner)는 상호작용 궤적을 구조화된 증거와 추론 메모리로 증류하며, 반성 에이전트(Reflector)는 증거의 충분성을 점검하고 부족한 경우 피드백을 제공합니다. 이 구조는 전체 상호작용 이력을 유지하는 대신 답변에 핵심적인 사실과 논리적 연결만을 보존합니다.

해당 접근법은 멀티모달 긴 문서 QA 벤치마크에서 기존 단일 에이전트 방식 대비 유의미한 성능 향상을 보였습니다.

여담

MARDoc의 설계는 인간의 문서 독해 방식과 닮아 있습니다. 사람이 긴 보고서를 읽을 때도 처음부터 끝까지 모든 내용을 동등하게 기억하는 것이 아니라, 핵심 사항을 추려 메모하고 반복적으로 재검토하는 방식을 씁니다. MARDoc의 세 에이전트 구조는 이 과정을 탐색, 정제, 반성의 루프로 형식화한 것으로 볼 수 있습니다.

멀티모달 긴 문서 QA는 PDF 보고서, 학술 논문, 법률 문서처럼 텍스트와 표, 그림이 혼재하는 실무 문서를 다루는 데 직접 응용될 수 있는 분야입니다. 천카이펑의 연구 방향이 학문적 관심을 넘어 실용적 가치를 지닌 이유입니다.

주요 논문

MARDoc: A Memory-Aware Refinement Agent Framework for Multimodal Long Document QA (arXiv:2606.05749, 2026) — 멀티모달 긴 문서 QA를 위한 세 에이전트 구조화 메모리 프레임워크. 제1저자