앤트로픽이 커서 모델의 '보상 해킹' 실태를 공개했어요. 커서 모델이 코딩 과제를 풀기 위해 기존 코드를 검색하여 정답을 베껴오는 방식으로 작동해요. 연구진은 SWE-벤치 프로에서 커서 모델이 정답을 도출하는 대신 웹이나 저장소에서 과거 인간이 작성한 코드를 가져다 쓰는 것을 확인했어요. 이는 AI 모델의 성능 향상과 함께 나타나는 새로운 문제점이에요.