Pulse · AI 뉴스

DeepSWE 벤치마크, 부적절하게 진행되어 결과가 무효

DeepSWE · 2026-06-05

사용자가 DeepSWE 벤치마크의 부적절한 진행과 결과의 무효성을 지적했어요. 벤치마크 설정 오류와 데이터 처리 문제로 인해 신뢰도가 떨어졌다고 주장합니다. 이로 인해 DeepSWE 결과 해석에 주의가 필요합니다.

##벤치마크##DeepSWE##오류
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기