앤트로픽의 클로드 오퍼스 4.8이 새로운 코딩 벤치마크 딥SWE에 처음 포함됐어요. 이전 버전과 GPT-5.4를 능가했지만 GPT-5.5에는 미치지 못했어요. 딥SWE 업데이트에 따르면 클로드 오퍼스 4.8은 58%의 정답률을 기록했는데, GPT-5.5는 70%의 정답률로 1위를 유지했어요.