아티피셜 애널리시스(AA)가 AI 코딩 에이전트 성능 평가 벤치마크를 'SWE-벤치 프로'에서 '딥SWE'로 변경했어요. 새로운 벤치마크 도입 결과, 클로드 페이블 5가 첫 평가에서 코딩 순위 1위를 차지했어요. 데이터커브(Datacurve)가 새 벤치마크로 도입되었으며, 일부 모델의 순위가 변경되었어요.