AudioFace는 음성-구동 얼굴 애니메이션 프레임워크로, 언어와 음성 정보를 결합하여 입 모양 관련 얼굴 움직임을 생성합니다. 기존 방식은 음성 신호만으로 얼굴 계수를 예측하지만, AudioFace는 음성 생성의 언어적, 음운적 구조를 고려합니다. 실험 결과, AudioFace는 여러 평가 지표에서 우수한 성능을 보여 언어 기반의 다중 모달 접근 방식의 효과를 입증했습니다.