Transformer Lab에서 Ideogram 4.0 모델을 양자화하여 24GB GPU에서도 실행 가능하도록 만들었어요.
INT8 모델은 고품질 FP8 빌드와 유사한 성능을 제공하며, 텍스트 품질이 뛰어나 24GB 3090에서 사용하기 적합해요.
Q4_K GGUF 모델은 10.4GB 크기로 NF4보다 성능이 뛰어나고, VRAM이 부족한 환경에서도 사용 가능해요.
텍스트 기반 프롬프트에서 NF4 대비 성능 향상이 두드러지며, 동일 프롬프트와 시드를 사용한 비교 테스트 결과 텍스트가 선명하게 유지돼요.