Gemma 모델의 MTP (Memory Transformer Pipeline) 버전이 개발 중입니다. 현재는 직접 컴파일해야 하며, 완벽하게 작동하지 않을 수 있습니다. Reddit 사용자 jacek2023이 관련 정보를 공유했습니다.
MTP는 메모리 사용량을 줄여 대규모 모델을 효율적으로 실행하는 기술입니다. Gemma 4 모델에 적용하여 성능 개선을 목표로 하는 것으로 보입니다.
이 프로젝트는 아직 개발 초기 단계이며, 사용자들은 직접 컴파일하여 테스트해 볼 수 있습니다.