Pulse · AI 뉴스

Qwen 3.6-27B 모델 MTP 적용 시 Strix Halo Windows 환경 벤치마크 결과

Qwen · 2026-05-17

Qwen 3.6-27B 모델에 MTP(Mosaic Transformer Pipeline)를 적용했을 때 Strix Halo Windows 환경에서 벤치마크 결과가 공개됐어요. 특정 작업에서 토큰 생성 속도가 향상되는 모습을 확인할 수 있었어요. Reddit 사용자가 llama.cpp를 활용해 테스트한 결과를 공유했어요.

Task 1, 2, 3에서 Qwen 3.6-27B Dense 모델과 MTP 적용 모델의 토큰 생성 속도를 비교한 결과, 작업에 따라 속도 차이가 나타났어요. 특히 Task 3에서는 MTP 적용 모델이 **17.9 tokens/s**의 속도를 기록하며 두드러진 성능 향상을 보였어요.

Reddit 사용자는 Qwen 3.6-27B 모델의 다양한 설정과 MTP 적용 시 성능 변화를 테스트하며, 사용자 맞춤 설정을 통해 성능 최적화를 할 수 있음을 시사했어요.

##Qwen##모델벤치마크##MTP
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기