FacePlex는 실시간 양방향 음성 및 표정 생성을 가능하게 하는 새로운 프레임워크입니다. 기존 모델은 음성만 생성하거나, 음성에 맞춰 표정을 애니메이션하는 방식이었어요.
Rolling Flow Matching과 Rolling Cross-Attention 기술을 활용해 실시간 스트리밍 환경에서도 음성과 표정을 동시에 생성합니다.
FacePlex는 기존 방식 대비 입술 동기화 품질과 표정 충실도가 향상된 것으로 나타났으며, 사용자 평가에서도 긍정적인 결과를 얻었습니다.