Pulse · AI 뉴스

MI50s GPU에서 Qwen 3.6 27B 모델 추론 성능 테스트 결과 공개

Qwen · 2026-05-14

MI50s GPU에서 Qwen 3.6 27B 모델의 추론 성능을 테스트한 결과, 1,000 토큰 프롬프트에서 52.8 tps, 15,000 토큰 프롬프트에서 1569 tps의 성능을 보여줬어요.

vllm fork v0.20.1을 사용했으며, 128K 컨텍스트를 지원하고, full precision으로 테스트했어요.

연구자는 소프트웨어 및 하드웨어 스택을 개선하면 더 높은 성능을 낼 수 있다고 언급하며, PCIe 스위치 사용 및 ROCm/gfx906에 최적화된 DFlash/MTP 적용 가능성을 제시했어요.

결과를 바탕으로 Claude Code나 Hermes와 같은 에이전트 하니스를 활용하기에 적합하다고 판단했어요.

##Qwen##MI50s##추론##vllm##GPU

매일 핵심 AI 소식을 한국어로, 빠르게