MTP (Multi-Token Prediction) 기술은 코딩 에이전트의 LLM 추론 속도를 최대 2배까지 가속화할 수 있어요. AMD Strix Halo 및 Dual Radeon 9700 환경에서 Qwen 3.6 모델의 성능 향상을 보여주는 영상이 공개됐어요. MTP 기술은 토큰 생성 속도를 높여 LLM 활용성을 개선하는 데 기여할 것으로 기대돼요.