Pulse · AI 뉴스

300달러 랩탑에서 Qwen 3.5 35B 추론 속도 10.33 t/s 달성

Qwen · 2026-05-28

사용자가 Qwen 3.5 35B 모델을 300달러 랩탑에서 추론 테스트했어요. ik_llama.cpp 백엔드를 사용해 토큰당 10.33 t/s의 빠른 속도를 기록했어요.

Qwen 3.5는 유사 크기의 다른 모델보다 빠르며, Gemma 4 26b a4b 모델보다 약 3배 빠른 속도를 보였어요. 이는 Qwen 3.5의 아키텍처적 특징 때문으로 추정돼요.

쿨링 페이스트 업그레이드, XMP 메모리 타이밍 설정 등을 통해 추론 속도를 더 개선할 수 있으며, 현재는 랩탑 코어 0과 2에 성능 코어만 고정해 사용 중이에요.

##LLM##Qwen##추론##랩탑##ik_llama

매일 핵심 AI 소식을 한국어로, 빠르게