llama.cpp와 ik_llama.cpp가 각각 NVFP4와 MXFP4라는 FP4 지원을 추가했어요. NVFP4는 엔비디아 블록 스케일 FP4 방식이고, MXFP4는 MX 컨소시엄 표준을 따르는 방식이에요. 두 방식 모두 4비트 부동 소수점 영역에 속하며, 모델 지원이 확산되면 상당한 VRAM 절감 효과를 가져올 것으로 기대돼요.