Pulse · AI 뉴스

780M iGPU에서 Qwen3.6 35B-A3B 성능 테스트: llama.cpp(vulkan) 활용

Qwen · 2026-04-24

ThinkPad T14 Gen 5의 Radeon 780M iGPU에서 Qwen3.6 35B-A3B 모델을 llama.cpp(vulkan)로 실행한 결과, pp/tg 속도가 상당히 우수했어요.

Q6 퀀타이제이션을 사용하기 위해 커널 파라미터를 조정했는데, 전체 컨텍스트에서도 원활하게 작동했어요.

Qwen 팀의 노력을 칭찬하며, 780M iGPU에서 35B 모델을 실행할 수 있다는 점이 인상적이에요.

##Qwen##llama.cpp##vulkan##iGPU##벤치마크

매일 핵심 AI 소식을 한국어로, 빠르게