Junbo Niu

🏷️ 인물 문서파싱 머신러닝

Junbo Niu는 상하이 인공지능 실험실(OpenDataLab)의 1저자 연구원입니다. 문서 이해 분야에서 일관된 기여를 이어가고 있으며, MinerU2.5 프로젝트에서 핵심 1저자로 분리 아키텍처와 2단계 파싱 전략을 주도했습니다.

MinerU 시리즈의 진화를 통해 Niu는 문서 파싱의 체계적 접근을 보여줍니다. 이전 버전부터 축적된 문서 다양성 데이터셋과 고효율 모델 설계에 집중하고 있으며, v2.5에서는 IMC (Iterative Mining via Inference Consistency) 전략으로 자동 하드케이스 발굴 파이프라인을 구축했습니다. 이를 통해 1.2B 파라미터 모델로 범용 72B 모델을 초월하는 성능을 달성했습니다.

OpenDataLab이 주도적으로 공개한 MinerU 오픈소스 프로젝트는 문서 파싱 커뮤니티의 데팩토 표준이 되고 있으며, Niu의 연구는 산업 응용(금융보고서 자동화, 법률 문서 구조화) 및 학술 벤치마크(OmniDocBench, Ocean-OCR)에서 직접 검증되고 있습니다.