ggml-cuda에서 Mistral Small 4 모델의 CUDA 가속 지원이 추가되었어요. 이전에는 CPU로 처리되었던 부분이 개선되었어요. DKQ=320/DV=256 및 ncols2=32 설정으로 최적화되었으며, 이는 Mistral 모델과 관련이 있을 가능성도 제기되고 있어요. 이 변경 사항은 Reddit 사용자 jacek2023에 의해 제안되었으며, llama.cpp 프로젝트의 Pull Request #22286으로 등록되었어요.