Pulse · AI 뉴스

ReQAT: 4비트 부동소수점 양자화 인식 훈련으로 완벽한 정밀도 추론 정확도 달성

ReQAT · 2026-06-14

연구진은 대규모 추론 모델(LRM)의 배포 비용을 줄이기 위해 ReQAT라는 새로운 훈련 프레임워크를 제안했어요. ReQAT는 4비트 부동소수점 양자화 인식 훈련 방식으로, 추론 과정에서 발생하는 오류를 줄이는 데 집중해요.

Trace-Aligned QAT, Selective Entropy Minimization, Q-FIT의 세 가지 핵심 구성 요소를 통해 기존 양자화 방식보다 높은 정확도를 회복하고 BF16 미세 조정 정확도를 능가했어요.

NVIDIA DGX Spark에서 최대 3.9배, B200에서 3.1배의 처리량 속도 향상을 달성하며, 추론 성능과 효율성을 동시에 개선했어요.

##양자화##추론##ReQAT##훈련##NVIDIA
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기