Pulse · AI 뉴스

AMD RDNA2 GPU에서 Flash Attention 활성화로 속도 2배 향상

Minerest · 2026-05-19

Minerest가 AMD RDNA2 GPU에서 Flash Attention을 활성화하는 맞춤형 빌드를 공개하여 속도를 2배 향상시켰습니다.

이 빌드는 기존 rocm 환경에서 발생하는 충돌 문제를 해결하고 qwen3.6 35B 모델에서 70-80 tok/s의 성능을 제공합니다.

사용자는 GitHub 저장소에서 빌드를 다운로드하여 직접 테스트해 볼 수 있으며, Gemma 모델이나 Deepseek 모델은 불안정할 수 있습니다.

##AMD##RDNA2##FlashAttention##ROCm##llama.cpp
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기