Pulse · AI 뉴스

Qwen3.6-27B KLDs, INTs 및 NVFPs 비교 분석

Qwen · 2026-04-23

Phaelon74 사용자가 Qwen3.6-27B 모델의 다양한 양자화 방식(KLDs, INTs, NVFPs)을 비교하는 그래프를 공유했어요.

THoTD는 NVFP4A16 방식, 다른 모델들은 NVFP4(A4) 방식을 사용하며, THoTD가 더 큰 크기를 가진다는 점을 강조했어요.

Cyan 모델의 경우 INT4에서 BF16-INT4로 전환 시 크기가 크게 증가하며, 혼합 정밀도의 장단점을 고려해야 한다고 조언했어요.

##모델비교##양자화##Qwen
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기