연구진이 음성 스트림에서 실시간 고품질 3D 캐릭터 애니메이션을 생성하는 새로운 프레임워크 'EchoAvatar'를 공개했어요. EchoAvatar는 대화형 음성 및 음악을 모두 처리할 수 있는 통합 스트리밍 아키텍처를 사용하며, 명시적 도메인 레이블이나 모드 전환 없이도 자연스러운 움직임을 생성해요. LLM과 연동 가능한 툴콜 인터페이스를 통해 의도 기반 동작을 제어하고, 기존 실시간 기반 모델보다 높은 품질과 동기화 성능을 보여줘요.