Pulse · AI 뉴스

토큰에서 얼굴로: 3D 얼굴 애니메이션을 위한 이산 음성 표현 조사

arXiv cs.CL · 2026-06-12

연구진은 음성 기반 3D 얼굴 애니메이션에서 음성 표현 방식이 중요하다고 밝혔어요. SSL 특징, 신경 코덱, ASR 방식 등 다양한 표현 방식을 평가하여 얼굴 재구성 품질을 비교했어요. 연구 결과, 음성 표현 방식에 따라 얼굴 애니메이션 예측 정확도가 달라지는 것을 확인했어요.

새로운 AVTTS 파이프라인을 통해 음성과 3D 얼굴 움직임을 디스크리트 표현이라는 공유 공간으로 디코딩하는 방법을 제시했어요. 이 파이프라인은 음성 표현 방식이 얼굴 애니메이션 품질에 미치는 영향을 최소화하면서도 효율적인 애니메이션 생성을 가능하게 해요.

음성 표현 방식이 음성 기반 3D 얼굴 애니메이션의 품질에 중요한 영향을 미치며, 음성 표현 방식 선택에 따라 애니메이션의 정확도와 효율성이 달라질 수 있다는 점을 강조했어요.

##3D얼굴애니메이션##음성표현##AVTTS##딥러닝##음성인식
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기