MiniMax 팀이 Qwen3.5-35B 모델에서 130 토큰/초의 피크 속도를 기록한 GB10 솔루션 아틀라스의 코드를 오픈 소스로 공개했습니다. 아틀라스는 순수 Rust와 CUDA로 개발되었으며, 128K 컨텍스트를 지원하고, 2분 이내에 콜드 스타트가 가능합니다. Qwen3.5-35B 모델의 경우 vLLM보다 3~3.3배 빠른 속도를 제공하며, OpenAI 및 Anthropic API를 동일 포트에서 사용할 수 있습니다.