Pulse · AI 뉴스

Qwen 27B 모델, 3090TI에서 Reddit에 올라온 성능 나오지 않는 이유 분석

Qwen · 2026-04-30

Reddit 사용자 Qwen 27B 모델을 3090TI에서 실행하는데 Reddit에서 보이는 높은 토큰 생성 속도를 내지 못해 어려움을 겪고 있다고 토로했어요.

Claude Sonnet 4.6 분석 결과, CPU의 SSM 상태 업데이트 연산이 병목 현상을 일으키며 토큰 생성 속도를 제한하는 것으로 나타났어요.

CPU 아키텍처에 따라 AVX-512/AVX-VNNI 지원 여부에 따라 성능 차이가 발생하며, i9-9900K 사용자는 18~19 토큰/초가 현실적인 최대 속도라고 해요.

##Qwen##모델성능##llama.cpp##SSM##CPU병목
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기