Pulse · AI 뉴스

저비트 양자화 시 시각-언어 모델의 양극성 문제 해결: SplitQ

SplitQ · 2026-05-19

연구진은 시각-언어 모델(VLM)의 저비트 양자화(PTQ) 과정에서 발생하는 정확도 저하 문제를 해결하기 위해 SplitQ 프레임워크를 제안했습니다.

SplitQ는 각 모달리티별 이상치 채널을 분리하는 MOCD 모듈과 모달리티 간 분포 차이를 보정하는 ACC 모듈을 도입하여 성능을 향상시킵니다.

실험 결과, SplitQ는 W3A3 환경에서 FP16 성능의 93.5%를 유지하며 기존 방법 대비 우수한 성능을 보였습니다.

##VLM##양자화##SplitQ##인공지능

매일 핵심 AI 소식을 한국어로, 빠르게