Google의 Gemma 12b 모델이 Termux 환경에서 10W 미만으로 구동되며 6.5t/s의 프롬프트 처리 속도를 기록했어요. llama.cpp를 활용한 실험 결과, 1.3t/s의 생성 속도를 보여줬으며, 모델 드래프트 및 컨텍스트 타입 최적화가 적용됐어요. Reddit 사용자가 관련 정보를 공유하며, 저전력 환경에서 LLM 활용 가능성을 시사했어요.