Pulse · AI 뉴스

샤오미, 8GPU 서버로 1조 파라미터 모델에서 초당 1000TPS 달성 주장

MiMo · 2026-06-09

샤오미가 MiMo-V2.5-Pro UltraSpeed 모델로 초당 1000 토큰 처리 속도(TPS)를 달성했다고 발표했어요. 이는 1조 파라미터 MoE 모델에 대해 8GPU 서버에서 구현된 결과예요.

기존 웨이퍼 스케일 하드웨어나 SRAM 기반 하드웨어가 아닌 표준 8GPU 노드를 사용했다는 점이 특징이에요. Cerebras나 Groq와 같은 특수 하드웨어가 아닌 일반적인 환경에서 달성했다는 점이 주목받고 있어요.

##MiMo##샤오미##모델출시
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기