Reddit 사용자 Qwen 27B 모델을 3090TI에서 실행하는데 Reddit에서 보이는 높은 토큰 생성 속도를 내지 못해 어려움을 겪고 있다고 토로했어요.
Claude Sonnet 4.6 분석 결과, CPU의 SSM 상태 업데이트 연산이 병목 현상을 일으키며 토큰 생성 속도를 제한하는 것으로 나타났어요.
CPU 아키텍처에 따라 AVX-512/AVX-VNNI 지원 여부에 따라 성능 차이가 발생하며, i9-9900K 사용자는 18~19 토큰/초가 현실적인 최대 속도라고 해요.