미니맥스가 초장문 컨텍스트 처리의 연산 비용 문제를 해결하는 희소 어텐션 기술 'MSA'를 공개했어요. MSA는 최대 100만 토큰 규모의 장기 컨텍스트에서 연산량을 28배 줄이고 추론 속도를 14배 향상시켰어요. MSA 기술을 서비스 모델 '미니맥스-M3'에 적용하고, 관련 추론 커널을 오픈소스로 공개하여 개발자들의 활용도를 높일 예정이에요.