본 연구는 양자화 행렬 곱셈(MatMul)에 대한 두 번째 논문으로, LLM의 가중치 양자화에 활용되는 설정에 초점을 맞추고 있습니다. WMSE 소스 코딩의 워터필링 솔루션을 활용하여 기존 양자화 알고리즘(GPTQ)의 성능을 개선할 수 있음을 보여줍니다. WaterSIC 방식은 기존 방식과 달리 기준 자유적이며, 이론적 왜곡 제한에 근접하는 성능을 보이며, GPTQ 또한 고정밀 영역에서 최적에 가깝습니다.