연구진은 실시간 텍스트 기반 오디오-비디오 아바타 생성 프레임워크 Hallo-Live를 개발했어요. Hallo-Live는 비동기 듀얼 스트림 확산과 인간 중심 선호도 증류를 결합하여 속도와 품질을 모두 개선했어요. 두 개의 NVIDIA H200 GPU에서 Hallo-Live는 20.38 FPS로 실행되며, 기존 모델보다 훨씬 높은 처리량과 낮은 지연 시간을 보여줬어요.