Pulse · AI 뉴스

Kimi-K2.6-GGUF Q4_X 모델 출시: 584GB RAM+VRAM 필요

Kimi · 2026-04-21

jukofyork와 AesSedai의 도움으로 Kimi-K2.6 모델의 '전체 크기' Q4_X 양자화 패치가 완료되었어요.

이 모델은 ik와 mainline llama.cpp에서 실행 가능하며, 약 584GB 이상의 RAM+VRAM이 필요해요.

AesSedai는 곧 MoE에 최적화된 레시피를 공개할 예정이며, imatrix를 활용한 사용자 정의 양자화 정보도 제공될 예정이에요.

##모델출시##양자화##llama.cpp

매일 핵심 AI 소식을 한국어로, 빠르게