사용자가 개인 AI 비서 개발 시, 제한된 기능과 컨텍스트를 가진 '앱' 환경을 구축하는 방법을 공유했어요. 이를 통해 소형 모델도 복잡한 작업을 효율적으로 수행하도록 했습니다.
앱 환경은 특정 웹 브라우저나 PC 제어 인터페이스처럼, 모델이 정확한 URL과 텍스트를 처리하도록 돕고, 20개 이상의 도구를 통합하여 사용성을 높여요.
gemma4 26B 모델과 gemma4 E4B 모델을 비교한 결과, E4B 모델이 이 워크플로우 환경에서 더 나은 성능을 보여줬으며, 이는 10k 토큰 컨텍스트에서 800t/s의 빠른 프리필 속도를 기록했어요.