Pulse · AI 뉴스

화웨이, 차이나모바일과 AI 추론 가속 솔루션 상용망 검증 성공

Huawei · 2026-06-30

화웨이가 차이나모바일 후베이와 협력해 AI 추론 가속 솔루션을 상용망에서 검증하는 데 성공했어요. 이 솔루션은 토큰 처리량을 최대 3.7배 향상시키고, AI 에이전트의 성능을 높여요.

화웨이 오션스토 A800 스토리지와 어센드 A3 슈퍼팟, 통합 캐시 관리자(UCM) 기반으로, 통신사가 AI 컴퓨팅 서비스를 배포할 수 있는 토대를 마련했어요. UCM은 외부 스토리지를 활용해 페타바이트(PB)급 KV 캐시를 구현하고, 장문 추론 성능을 개선해요.

미니맥스 M2.5는 첫 토큰 생성 시간 62% 단축, GLM-5.1은 372% TPS 향상 등 괄목할 만한 성능 향상을 보여줬으며, 이는 컨텍스트 길이가 길어질수록 솔루션의 강점이 더욱 뚜렷해짐을 입증했어요.

##화웨이##차이나모바일##AI추론##가속솔루션
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기