GDPval

🏷️ 벤치마크 AI평가 정보

GDPval

GDPval은 OpenAI가 주도해 공개한 직무 기반 모델 평가 벤치마크다. "모델이 경제적 가치가 있는 일을 실제로 해낼 수 있는가"를 측정하는 방향으로 설계됐다. 학술 지식 위주의 벤치마크와 대비되는 프레이밍이다.

구성

평가 방식

주요 수치

2026년 4월 기준 GPT-5.4가 약 83%. 프론티어 모델이 여러 학술 벤치마크에서 90%+를 기록하는 와중에도 GDPval은 직무 맥락에서의 실제 사용성 관점에서 차이를 드러낸다.

의의

OfficeQA Pro와 함께 "실제 업무 기반 평가" 계열의 대표 벤치마크로 자리 잡았다.