Kimi K2-Thinking 모델이 새로운 오픈 소스 사고 모델로 공개되었어요. 이 모델은 단계별 추론과 도구 활용을 통해 Humanity's Last Exam (HLE) 등 다양한 벤치마크에서 최고 성능을 달성했어요.
K2-Thinking 모델은 INT4 양자화 모델로, 256k 컨텍스트 윈도우를 지원하며 추론 지연 시간과 GPU 메모리 사용량을 줄이는 데 기여해요.
이 모델은 200~300단계의 연속적인 도구 호출에서도 안정적인 목표 지향적 행동을 유지하며, 이전 모델의 한계를 극복했어요.