Pulse · AI 뉴스

클로드 미소스, METR 자율성 평가서 '16시간' 기록…AI 자율성 급증

Claude Mythos · 2026-05-11

AI 자율성 평가 기관 METR이 클로드 미소스 초기 버전을 평가한 결과, 인간 전문가가 16시간 동안 수행하는 작업을 50%의 성공률로 처리했습니다.

클로드 미소스는 기존 벤치마크를 넘어 AI의 자율성을 측정하는 새로운 지표인 '작업 완료 시간 지평'을 통해 평가되었습니다.

이번 평가는 AI가 인간 전문가의 하루치 업무를 독립적으로 수행할 수 있는 수준에 도달했음을 시사하며, AI 자율성 향상의 가능성을 보여줍니다.

##AI자율성##클로드미소스##METR
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기