ParoQuant은 LLM 추론 효율성을 높이기 위한 새로운 양자화 기법입니다. 쌍별 회전 양자화를 통해 기존 양자화 방식보다 성능 저하를 최소화하면서도 추론 속도를 향상시킵니다. Z Lab에서 개발했으며, GitHub와 Hugging Face에서 관련 자료를 확인할 수 있습니다.