Pulse · AI 뉴스

Zai, GLM-5.1 추론 네트워크 아키텍처 변경으로 성능 향상

GLM · 2026-05-28

Zai가 GLM-5.1 코딩 추론을 위해 ROFT 대신 자체 개발한 ZCube 네트워크 아키텍처로 전환했어요.

ZCube는 Tsinghua University와 HarnetsAI와 협력하여 개발되었으며, 스위치 및 광 모듈 비용을 33% 절감하고 GPU 추론 처리량을 15% 향상시켰어요.

Prefill-Decode 분산 추론에서 발생하는 KV 캐시 전송 문제를 해결하여 첫 번째 토큰 지연 시간을 40.6% 감소시켰어요.

##GLM##Zai##네트워크
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기