ggml-org에서 llama.cpp의 b9200 버전을 공개했어요. MTP (Multi-Piece Transformer) 프롬프트 처리 시 로짓 복사를 줄여 메모리 트래픽을 감소시키고 PP (Prompt Per Second) 속도를 향상시켰어요. am17an이 메모리 트래픽 감소 효과를 확인하며 MTP 성능 향상을 기대하고 있어요.