Pulse · AI 뉴스

llama.cpp 및 ik_llama.cpp에 FP4 추론 지원 추가 - 드디어

llama.cpp · 2026-04-26

llama.cpp와 ik_llama.cpp가 각각 NVFP4와 MXFP4라는 FP4 지원을 추가했어요.

NVFP4는 엔비디아 블록 스케일 FP4 방식이고, MXFP4는 MX 컨소시엄 표준을 따르는 방식이에요.

두 방식 모두 4비트 부동 소수점 영역에 속하며, 모델 지원이 확산되면 상당한 VRAM 절감 효과를 가져올 것으로 기대돼요.

##모델출시##FP4##llama.cpp

매일 핵심 AI 소식을 한국어로, 빠르게