Gemini-2.5 Pro

🏷️ 모델 멀티모달 LLM

Gemini-2.5 Pro는 Google DeepMind의 최신 멀티모달 생성형 모델입니다. Gemini 2.5 시리즈의 일부로, 텍스트·이미지·음성을 통합 처리하며 특히 장문맥 이해와 복잡한 추론에 최적화되어 있습니다.

Gemini-2.5 Pro의 주요 특징: - 1M 토큰 컨텍스트: 수십만 단어 분량의 문서·코드를 한 번에 처리 - 강화된 추론: 수학·코딩·논리 문제에서 개선된 성능 - 멀티모달 이해: 고해상도 이미지, 비디오, 음성 처리 - 비용-성능 균형: 중간 크기 모델로 경제적 사용

문서 파싱 벤치마크(OmniDocBench, Ocean-OCR)에서 Gemini-2.5 Pro는 MinerU2.5 같은 전문 모델과의 비교 대상이 되며, 범용성에서는 강하지만 도메인별 정확도에서는 특화 모델에 밀립니다. MinerU2.5의 데이터 엔진에서도 자동 주석 보정 모델로 활용됩니다.