사용자가 GPTQ 양자화 과정에서 발생하는 수학적 보상 기법을 직접 derivation 하여 상세 분석 결과를 공개했어요. GPTQ는 가중치를 독립적으로 취급하는 것이 아니라 상관관계에 있다고 가정하며, 가중치를 4비트 그리드로 강제할 때 주변 가중치를 조정하여 손실을 흡수합니다. Hessian 행렬을 활용한 업데이트 규칙, Cholesky 분해 적용 이유, 메모리 효율적인 구현 방식 등 실무적인 내용도 다룹니다.