Pulse · AI 뉴스

b9200 릴리스: MTP PP 증가 가능성

llama.cpp · 2026-05-18

ggml-org에서 llama.cpp의 b9200 버전을 공개했어요.

MTP (Multi-Piece Transformer) 프롬프트 처리 시 로짓 복사를 줄여 메모리 트래픽을 감소시키고 PP (Prompt Per Second) 속도를 향상시켰어요.

am17an이 메모리 트래픽 감소 효과를 확인하며 MTP 성능 향상을 기대하고 있어요.

##llama.cpp##MTP##성능향상##ggml
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기