사용자가 DeepSWE 벤치마크의 부적절한 진행과 결과의 무효성을 지적했어요. 벤치마크 설정 오류와 데이터 처리 문제로 인해 신뢰도가 떨어졌다고 주장합니다. 이로 인해 DeepSWE 결과 해석에 주의가 필요합니다.