문샷 AI가 Kimi-VL-A3B-Thinking 모델을 공개했는데, 이 모델은 2.8B 파라미터만 활성화하여도 뛰어난 멀티모달 추론, 장문 맥락 이해, 강력한 에이전트 기능을 제공해요.
Kimi-VL-A3B-Thinking은 OSWorld와 같은 멀티턴 에이전트 상호작용에서 최고 수준의 성능을 보이며, GPT-4o-mini, Qwen2.5-VL-7B, Gemma-3-12B-IT 등과 경쟁해요.
128K 확장된 맥락 창을 통해 긴 입력 처리 능력을 갖추고 있으며, MMMU, MathVision, MathVista 등 다양한 벤치마크에서 높은 점수를 기록했어요.