연구진은 시각-언어 모델(VLM)의 저비트 양자화(PTQ) 과정에서 발생하는 정확도 저하 문제를 해결하기 위해 SplitQ 프레임워크를 제안했습니다. SplitQ는 각 모달리티별 이상치 채널을 분리하는 MOCD 모듈과 모달리티 간 분포 차이를 보정하는 ACC 모듈을 도입하여 성능을 향상시킵니다. 실험 결과, SplitQ는 W3A3 환경에서 FP16 성능의 93.5%를 유지하며 기존 방법 대비 우수한 성능을 보였습니다.