1.2B 파라미터로 고해상도 문서의 정확한 파싱을 달성한 MinerU2.5의 2단계 분리 아키텍처와 데이터 엔진을 분석합니다.
태그: 문서파싱
6개의 게시물
-
-
OpenDataLab 이사이자 프로젝트 리더, 비전-언어 모델의 데이터 엔지니어링 전문가
-
중국발 멀티모달 문서 파싱 플랫폼, 다양한 크기의 특화 모델 제공
-
상하이 인공지능 실험실, 문서 이해와 고효율 모델 연구의 중심 기관
-
OpenDataLab의 연구원으로 문서 이해와 고효율 VLM을 중점 연구
-
멀티언어 OCR 및 문서 파싱 플랫폼, 다국어 지원 강화