Reddit 사용자가 Gemma 4-31B 모델과 3D 아바타를 통해 음성 대화하는 데모를 공개했어요. 사용자의 음성을 인식하고, 음성 및 얼굴 표정과 함께 답변하며, Gemma가 표정을 결정해요.
실시간 음성 채팅 데모는 Silero VAD, Parakeet, Gemma 4-31B, Qwen3-TTS 등 오픈 소스 모델로 구축됐어요.
Cerebras 서버를 통해 Gemma 4-31B가 제공돼 빠른 응답 속도를 보장하며, TalkingHead와 HeadAudio를 활용해 입술 동기화 및 아바타 표현을 구현했어요.