Pulse · AI 뉴스

Gemma 4 E2B 및 E4B 어시스턴트 MTP 지원 - llama.cpp

Gemma · 2026-06-09

llama.cpp 프로젝트가 Gemma 4 E2B 및 E4B 어시스턴트 모델에 대한 MTP (Mobile Transformer Pipeline) 지원을 추가했어요. 이 기능은 모바일 기기나 저사양 환경에서 Gemma 모델을 실행하는 데 도움이 됩니다. Raspberry Pi나 안트와 같은 초소형 기기에서도 실행 가능하게 지원 범위를 확장했어요.

MTP는 모델 추론 속도를 높이고 메모리 사용량을 줄여 저사양 환경에서도 LLM을 사용할 수 있도록 해주는 기술이에요. max-krasnyansky가 이 기능을 개발했으며, 관련 pull request는 llama.cpp GitHub 저장소에서 확인할 수 있습니다.

##Gemma##MTP##llama.cpp##최적화
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기