Pulse · AI 뉴스

OpenAI, 실제 업무 기반 모델 성능 평가 지표 GDPval 공개

OpenAI · 2025-09-25

OpenAI가 실제 경제적 가치를 지닌 업무를 수행하는 모델 성능을 평가하는 새로운 지표 GDPval을 발표했어요.

GDPval은 44가지 직업군을 대상으로 모델의 실질적인 업무 수행 능력을 측정하며, 기존 평가 방식의 한계를 보완해요.

이 지표를 통해 OpenAI는 모델의 실용성과 경제적 효용성을 더욱 강조하고, 실제 활용 가능성을 높이는 데 주력할 계획이에요.

##모델평가##OpenAI##GDPval
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기