Pulse · AI 뉴스

오픈AI, 계산생물학 벤치마크 '진벤치-프로' 공개…최고 모델도 정답률 32%

OpenAI · 2026-07-02

오픈AI가 현실적인 계산생물학 AI 평가 기준 '진벤치-프로'를 공개했어요. 이 벤치마크는 유전체학, 정량생물학, 중개의학 관련 129개 문제로 구성돼요.

GPT-5.6 Sol Pro가 진벤치-프로에서 31.5%의 정답률을 기록하며 최고 성능을 보였지만, 실제 연구자 대체는 아직 어려워요.

오픈AI는 대표 문항을 공개해 후속 연구자들이 동일한 기준으로 성능을 비교할 수 있도록 했어요.

##AI##오픈AI##벤치마크

매일 핵심 AI 소식을 한국어로, 빠르게