사용자가 commodity 하드웨어에서 생산성을 높이기 위해 MoE 에디션의 Gemma 4 및 Qwen 3.6을 사용해왔습니다. 라마 cpp의 자세한 출력을 분석하여 버퍼 할당, 함수 및 백엔드별 그룹화, 유용한 합계를 제공하는 스크립트를 개발했습니다. 스크립트는 초당 토큰 수와 같은 유용한 통계를 제공하며, Linux 환경에서 llama cpp 명령이 포함된 run.sh 스크립트가 필요합니다.