연구진이 중간 단계를 생략하고 드라이빙 비디오와 참조 캐릭터를 직접 연결하는 엔드투엔드 캐릭터 애니메이션 프레임워크 SCAIL-2를 발표했어요.
SCAIL-2는 데이터 부족 문제를 해결하기 위해 다양한 캐릭터 애니메이션 서브태스크를 통합하고 MotionPair-60K 데이터셋을 구축했으며, 텍스트 지시와 시각 정보를 넘어 컨텍스트 마스크 조건부와 모드별 RoPE를 활용했어요.
연구 결과, SCAIL-2는 기존 방식보다 성능이 뛰어나며, 프로젝트 페이지에서 합성 데이터와 모델 가중치를 공개할 예정이에요.