Daemonix00 사용자가 GLM 5.2 FP8 모델을 H200 환경에서 테스트했어요. FP8 + FP8 KV 방식으로 Terminal-Bench 2.1에서 79.8%의 성능을 기록했는데, 타임아웃 오류가 1회 발생했어요. 공식 테스트 결과와 FP8 방식의 성능 차이를 비교하기 위한 실험이었어요.
총 89개의 작업 중 71개가 성공했고, 실패는 17개, 에러는 1개였으며, 입력 토큰은 218656815개, 출력 토큰은 4659650개였어요. 캐시 적중률은 98.8%를 기록했어요.
타임아웃 오류가 발생한 torch-tensor-parallelism 작업은 재실행하지 않았으며, 재실행 시 성능이 소폭 상승할 가능성이 있어요.