연구팀은 정확한 입술 움직임과 자연스러운 표정을 동시에 구현하는 새로운 음성 기반 3D 캐릭터 애니메이션 모델 'ReFree-S2V'를 발표했어요. ReFree-S2V는 기존 비디오 생성 모델을 기반으로 음성 정보의 세밀한 표현과 자연스러운 표정을 동시에 담아내도록 설계됐어요. 보상 없이 강화 학습을 활용해 부자연스러운 움직임을 방지하고, 기존 방식 대비 입술 동기화 정확도와 자연스러움 평가에서 뛰어난 성능을 보였어요.