RealJonathanYip 사용자가 ComfyUI 플러그인 'QuantFunc'을 공개했어요. 이 플러그인은 NVFP4/INT4 CUDA 커널을 사용하여 디퓨전 모델 추론 속도를 높여요.
Qwen-Image는 RTX 4090에서 0.9초 만에 1024px 이미지를 생성하며, 기존 FP8 방식보다 최대 11.7배 빠른 속도를 보여요.
Z-Image, Qwen-Image-Edit, Flux.2, Klein, Ideogram 모델을 지원하며, CUDA 12/13 환경에서 사용 가능해요.