llama.cpp 프로젝트에서 ggml-cpu를 최적화하여 x86 및 일반 CPU 환경에서 성능을 향상시켰습니다. 기존 0.3 t/s에서 1.7 t/s로 성능이 향상되었으며, 이는 AVX 또는 AVX512를 지원하지 않는 환경에서도 체감할 수 있는 변화입니다. Metal, Vulkan, CUDA 버전도 1비트 버전(Bonsai)을 지원하므로 함께 확인해 볼 것을 권장합니다.