llama.cpp 프로젝트에서 MTP(Multi-Turn Prompting) 초안 경로의 백엔드 샘플링 방식을 개선했어요. 이 변경은 MTP 성능 향상을 목표로 하며, gaugarg-nv가 제안하고 pull request 형태로 제출했습니다. llama.cpp는 LLM 추론을 위한 C++ 라이브러리로, MTP 성능 개선은 사용자 경험 향상에 기여할 수 있습니다.