사용자가 딥러닝 모델 추론 시 INT8 양자화가 FP16보다 더 높은 정확도를 보인다는 현상을 발견했어요. FP16은 FP32에 더 가까워야 한다고 예상했지만, 실제로는 INT8이 더 나은 성능을 보여줬다고 설명했어요. ONNX를 통해 모델을 내보냈으며, FP16은 직접 사용하고 INT8은 양자화를 통해 적용했다고 밝혔어요.