Minerest가 AMD RDNA2 GPU에서 Flash Attention을 활성화하는 맞춤형 빌드를 공개하여 속도를 2배 향상시켰습니다. 이 빌드는 기존 rocm 환경에서 발생하는 충돌 문제를 해결하고 qwen3.6 35B 모델에서 70-80 tok/s의 성능을 제공합니다. 사용자는 GitHub 저장소에서 빌드를 다운로드하여 직접 테스트해 볼 수 있으며, Gemma 모델이나 Deepseek 모델은 불안정할 수 있습니다.