Pulse · AI 뉴스

Gemma 12b, 10W 미만으로 6.5t/s 성능 달성

Gemma · 2026-06-15

Google의 Gemma 12b 모델이 Termux 환경에서 10W 미만으로 구동되며 6.5t/s의 프롬프트 처리 속도를 기록했어요.

llama.cpp를 활용한 실험 결과, 1.3t/s의 생성 속도를 보여줬으며, 모델 드래프트 및 컨텍스트 타입 최적화가 적용됐어요.

Reddit 사용자가 관련 정보를 공유하며, 저전력 환경에서 LLM 활용 가능성을 시사했어요.

##Gemma##llama.cpp##Termux##LLM##성능

매일 핵심 AI 소식을 한국어로, 빠르게