연구진이 음성 이해를 위한 범용 인코더 USAD 2.0을 공개했어요. 자기 지도 학습과 감독 학습 기반 모델의 지식을 결합해 다양한 음성 도메인을 지원합니다. USAD 2.0은 교사 모델 불일치를 해결하기 위해 도메인 기반 증류를 도입하고, 음악 도메인 지원을 확대하며, 하위 작업 사용을 위한 2단계 감독 증류를 추가했습니다. 깊이 확장 방식으로 모델을 10억 파라미터 규모로 확장했으며, 다양한 평가에서 뛰어난 성능을 보였습니다.