Pulse · AI 뉴스

GB10 솔루션 아틀라스, 오픈 소스 공개… Qwen3.6-35B-FP8 100+ 토큰/초 추론 속도

Qwen · 2026-05-07

MiniMax 팀이 Qwen3.5-35B 모델에서 130 토큰/초의 피크 속도를 기록한 GB10 솔루션 아틀라스의 코드를 오픈 소스로 공개했습니다.

아틀라스는 순수 Rust와 CUDA로 개발되었으며, 128K 컨텍스트를 지원하고, 2분 이내에 콜드 스타트가 가능합니다.

Qwen3.5-35B 모델의 경우 vLLM보다 3~3.3배 빠른 속도를 제공하며, OpenAI 및 Anthropic API를 동일 포트에서 사용할 수 있습니다.

##모델출시##오픈소스##추론속도##GB10##Qwen
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기