ThinkPad T14 Gen 5의 Radeon 780M iGPU에서 Qwen3.6 35B-A3B 모델을 llama.cpp(vulkan)로 실행한 결과, pp/tg 속도가 상당히 우수했어요. Q6 퀀타이제이션을 사용하기 위해 커널 파라미터를 조정했는데, 전체 컨텍스트에서도 원활하게 작동했어요. Qwen 팀의 노력을 칭찬하며, 780M iGPU에서 35B 모델을 실행할 수 있다는 점이 인상적이에요.