Pulse · AI 뉴스

llama.cpp CPU 최적화: ggml-cpu 성능 향상

llama.cpp · 2026-04-21

llama.cpp 프로젝트에서 ggml-cpu를 최적화하여 x86 및 일반 CPU 환경에서 성능을 향상시켰습니다.

기존 0.3 t/s에서 1.7 t/s로 성능이 향상되었으며, 이는 AVX 또는 AVX512를 지원하지 않는 환경에서도 체감할 수 있는 변화입니다.

Metal, Vulkan, CUDA 버전도 1비트 버전(Bonsai)을 지원하므로 함께 확인해 볼 것을 권장합니다.

##llama.cpp##CPU최적화##ggml

매일 핵심 AI 소식을 한국어로, 빠르게