Moonshot AI가 새로운 하이브리드 선형 어텐션 아키텍처인 Kimi Linear-48B 모델을 공개했어요. Kimi Linear는 기존 어텐션 방식보다 짧은 문맥, 긴 문맥, 강화 학습 환경에서 모두 우수한 성능을 보여줘요. 모델은 최대 100만 토큰까지의 긴 문맥 처리에 필요한 KV 캐시 용량을 최대 75% 줄이고 디코딩 처리 속도를 최대 6배 향상시켰어요.