Pulse · AI 뉴스

ggml-cuda: Mistral Small 4 CUDA 가속 지원 추가 (DKQ=320/DV=256, ncols2=32)

Mistral · 2026-04-29

ggml-cuda에서 Mistral Small 4 모델의 CUDA 가속 지원이 추가되었어요. 이전에는 CPU로 처리되었던 부분이 개선되었어요.

DKQ=320/DV=256 및 ncols2=32 설정으로 최적화되었으며, 이는 Mistral 모델과 관련이 있을 가능성도 제기되고 있어요.

이 변경 사항은 Reddit 사용자 jacek2023에 의해 제안되었으며, llama.cpp 프로젝트의 Pull Request #22286으로 등록되었어요.

##Mistral##CUDA##llama.cpp##가속##최적화

매일 핵심 AI 소식을 한국어로, 빠르게