Pulse · AI 뉴스

AMD Strix Halo에서 HFQ4 사전 채우기 속도 3배 향상

hipfire · 2026-04-28

AMD 사용자가 hipfire에 MMQ(Matrix Multiplication Quantization) 기반 HFQ4 사전 채우기 경로를 추가하여 Strix Halo 시스템에서 사전 채우기 처리 속도를 기존보다 3배 이상 향상시켰어요.

새로운 경로는 Q8_1 MMQ 레이아웃으로 사전 채우기 활성화를 사전 양자화하고 i8 WMMA를 사용하여 GPU 실행에 최적화된 타일 기반 행렬-행렬 커널을 활용해요.

현재 RDNA3/RDNA3.5 GPU에서만 지원하며, 다른 AMD GPU 및 APU에서의 성능 검증과 장기 컨텍스트에서의 안정성 테스트가 필요한 상황이에요.

##AMD##hipfire##MMQ##RDNA3##HFQ4
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기