NVIDIA가 네모트론 3 울트라 모델의 NVFP4 체크포인트를 공개했어요. 모델 가중치를 효율적으로 이동시키는 데 중요한 양자화 기술이 사용돼요. NVIDIA 모델 최적화 도구를 활용해 체크포인트를 생성할 수 있어요. NVFP4는 4비트 양자화 방식을 사용하며, 모델 크기를 줄이고 추론 속도를 높여요. 이 방식은 긴 컨텍스트 윈도우에서 특히 효과적이에요. NVIDIA는 이 기술을 통해 대규모 모델의 성능을 향상시키고자 해요.