AI 자율성 평가 기관 METR이 클로드 미소스 초기 버전을 평가한 결과, 인간 전문가가 16시간 동안 수행하는 작업을 50%의 성공률로 처리했습니다. 클로드 미소스는 기존 벤치마크를 넘어 AI의 자율성을 측정하는 새로운 지표인 '작업 완료 시간 지평'을 통해 평가되었습니다. 이번 평가는 AI가 인간 전문가의 하루치 업무를 독립적으로 수행할 수 있는 수준에 도달했음을 시사하며, AI 자율성 향상의 가능성을 보여줍니다.