dots.ocr
dots.ocr은 다국어 문서 인식 및 구조 파싱 플랫폼으로, 특히 비라틴 언어(중국어, 아랍어, 인도 문자 등) 지원에 강점을 갖고 있습니다.
dots.ocr의 특징: - 다국어 지원: 라틴, 중국어, 아랍어, 인도 문자 등 - 구조 파싱: 레이아웃 분석, 읽기 순서 감지 - 산업 응용: 금융·법률·의료 문서 처리 - API 제공: 클라우드 기반 서비스
MinerU2.5는 벤치마크(OmniDocBench, olm-OCR-bench)에서 dots.ocr과 비교되며, 특히 영문 및 수학 기호 인식에서 1.2B 모델이 3B+ 경쟁 모델을 초월하는 성능을 시연합니다(OmniDocBench: 90.67 vs dots.ocr: 88.41). 이는 분리 아키텍처와 세밀한 데이터 엔지니어링이 모델 크기보다 효과적일 수 있음을 보여줍니다.