Pulse · AI 뉴스

역대급 벤치마크 ‘ALE’서 이변…GPT-5.5, '페이블 5' 꺾고 1위

OpenAI · 2026-06-12

앤트로픽의 '클로드 페이블 5'가 아닌 픈AI의 'GPT-5.5'가 새로운 벤치마크 'ALE'에서 1위를 차지했어요. ALE는 실제 전문가 수준의 장기 업무 수행 능력을 평가하는 새로운 벤치마크예요.

UC 버클리 연구진과 전문가 자문단이 개발한 ALE는 300명 이상의 자문단이 참여해 역대급 난이도로 설계됐어요. GPT-5.5는 이 벤치마크에서 '클로드 페이블 5'를 제쳤어요.

##ALE##GPT-5.5##ClaudeOpus
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기