사용자가 Z-Image Turbo 모델을 양자화하여 VRAM 문제를 해결하고자 합니다. bf16 체크포인트를 Q8 gguf 버전으로 변환하는 방법을 문의했어요. 관련 가이드가 있는지 궁금해합니다. 텍스트 인코더와 VAE를 함께 사용하면 VRAM을 초과하기 때문에 양자화를 통해 메모리 사용량을 줄이려는 목적입니다. gguf 형식으로 변환하는 구체적인 방법을 알고 싶어합니다.