MonkeyOCR

🏷️ 도구 OCR 문서파싱

MonkeyOCR은 문서 파싱·OCR 전문 플랫폼으로, 3B 및 1.2B 크기의 특화 모델(MonkeyOCR-Pro-3B, MonkeyOCR-pro-1.2B 등)을 제공합니다. 중국 개발진에 의해 주도되며, 특히 중국어·영어 혼합 문서에 최적화되어 있습니다.

MonkeyOCR의 특징: - 다중 크기 모델: 3B, 1.2B 등 효율성별 옵션 - 멀티국가 지원: 중국어, 영어, 다국어 OCR - 전문 성능: 표, 수식, 레이아웃 분석에 최적화 - 벤치마크 우수성: OmniDocBench 등에서 높은 성능

MinerU2.5는 벤치마크 비교에서 MonkeyOCR-Pro-3B를 주요 경쟁 대상으로 삼으며, OmniDocBench에서 1.2B 모델이 3B MonkeyOCR을 초월하는 성능(90.67 vs 88.85)을 보여줍니다. 이는 아키텍처 설계와 데이터 엔지니어링의 가치를 입증하는 핵심 벤치마크입니다.