애플 실리콘 사용 시 JANG 양자화 방식을 사용하면 모델 성능을 향상시킬 수 있습니다. 표준 양자화 방식으로는 최대 24 토큰/초(Tok/s)를 달성했지만, JANG 4M을 사용했을 때 30% 향상된 29/30 Tok/s를 기록했습니다. JANG는 애플 하드웨어에서 모델 성능을 최적화하는 데 효과적인 방법입니다.