Zhipu AI의 GLM 5.2가 Semgrep IDOR 취약점 탐지 벤치마크에서 Claude Code보다 높은 F1 점수를 기록했어요. 실험은 데이터셋과 평가 방식을 고정하고 모델과 하네스만 변경하여 GLM 5.2의 성능을 측정했어요. 결과는 GLM 5.2가 단순 프롬프트 조건만으로도 Claude Code를 능가하는 IDOR 탐지 능력을 보여줬어요.