Pulse · AI 뉴스

GLM 5.2 FP8 모델, Terminal-Bench 2.1에서 79.8% 성능 기록

GLM · 2026-07-06

Daemonix00 사용자가 GLM 5.2 FP8 모델을 H200 환경에서 테스트했어요. FP8 + FP8 KV 방식으로 Terminal-Bench 2.1에서 79.8%의 성능을 기록했는데, 타임아웃 오류가 1회 발생했어요. 공식 테스트 결과와 FP8 방식의 성능 차이를 비교하기 위한 실험이었어요.

총 89개의 작업 중 71개가 성공했고, 실패는 17개, 에러는 1개였으며, 입력 토큰은 218656815개, 출력 토큰은 4659650개였어요. 캐시 적중률은 98.8%를 기록했어요.

타임아웃 오류가 발생한 torch-tensor-parallelism 작업은 재실행하지 않았으며, 재실행 시 성능이 소폭 상승할 가능성이 있어요.

##GLM##FP8##H200##Terminal-Bench##모델테스트
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기