사용자 Perfect-Flounder7856가 정책 기반 추론 벤치마크에서 BF16 양자화가 압도적으로 성능이 좋다고 밝혔습니다. Q4 양자화는 실제로 사용할 수 없을 정도로 성능이 떨어진다고 언급했습니다. 산업 분야의 정책 기반 추론에서 BF16 양자화의 중요성을 강조하는 내용입니다.