사용자가 llama.cpp의 MTP 브랜치를 활용해 Qwen 3.6 27B 모델을 v100 GPU에서 테스트했습니다. MTP 활성화 시 54~55t/s의 성능을 기록했으며, 200k 캐시 제한과 vscode copilot으로 활용했습니다. am17an에게 감사하며, 해당 브랜치의 발전을 기대하고 있습니다.