Phaelon74 사용자가 Qwen3.6-27B 모델의 다양한 양자화 방식(KLDs, INTs, NVFPs)을 비교하는 그래프를 공유했어요. THoTD는 NVFP4A16 방식, 다른 모델들은 NVFP4(A4) 방식을 사용하며, THoTD가 더 큰 크기를 가진다는 점을 강조했어요. Cyan 모델의 경우 INT4에서 BF16-INT4로 전환 시 크기가 크게 증가하며, 혼합 정밀도의 장단점을 고려해야 한다고 조언했어요.