MiniMax가 새로운 어텐션 아키텍처 'MSA'를 공개했어요. MSA는 메모리 접근 패턴을 재구성하여 100만 토큰 컨텍스트를 효율적으로 처리합니다. MSA는 Flash-Sparse-Attention보다 4배 빠른 실행 속도를 보이며, 토큰당 연산량은 이전 모델 대비 1/20로 줄었습니다. MiniMax는 MSA를 통해 프론티어 코딩, 100만 토큰 컨텍스트, 네이티브 멀티모달리티를 모두 지원하는 첫 번째 오픈 웨이트 모델이라고 주장합니다.