Pulse · AI 뉴스

AMD APU에서 Qwen3.6-27B 모델 성능 대폭 향상: Luce DFlash + PFlash 적용

Qwen · 2026-05-13

Luce Org에서 AMD Ryzen AI MAX+ 395 iGPU(Strix Halo)에서 DFlash와 PFlash 지원을 출시하여 Qwen3.6-27B 모델의 성능을 크게 향상시켰습니다.

Luce DFlash를 사용한 Qwen3.6-27B 모델은 llama.cpp HIP 대비 최대 3.05배 빠른 프리필 속도를 보이며, 16K 컨텍스트에서 2.5배 빠른 전체 처리 시간을 기록했습니다.

128GB 통합 메모리를 가진 시스템에서 최대 100GB의 체크포인트를 호스팅할 수 있어, 기존 24GB GPU로는 불가능했던 대규모 모델도 구동할 수 있습니다.

향후 BSA 스코어링 커널, 멀티 로우 q4_K 디코드 GEMV, 타일 모양 튜닝 등을 통해 성능을 더욱 개선할 예정입니다.

##AMD##Qwen##DFlash##PFlash##LuceOrg

매일 핵심 AI 소식을 한국어로, 빠르게