qwen35 모델의 MTP (Mix-of-Experts) 연산 속도를 개선하는 pull request가 llama.cpp 저장소에 제출됐어요. post-norm hidden state를 활용하여 연산 효율성을 높이는 방식이에요. am17an 사용자가 제안한 변경 사항은 Qwen 모델의 성능 향상에 기여할 수 있을 것으로 기대돼요.