연구진은 음성 기반 모델의 표현 공간을 분리하여 작업별 성능을 향상시키는 개입적 대비 학습 방법을 제안했어요. 대비 손실 함수를 활용해 음성 콘텐츠와 화자 정보를 분리된 하위 공간으로 변환해요. 화자 검증 및 키워드 검색 작업에서 성능 향상과 함께 분리된 하위 공간이 학습되었음을 확인했어요.
기존 음성 기반 모델은 다양한 음성 변수를 분산적으로 표현하는데, 이는 작업에 필요한 일부 변수만 활용하는 것과 차이가 있어요. 연구진은 개입적 대비 학습을 통해 이러한 문제를 해결하고자 했어요.
개입적 데이터셋과 다중 대비 손실 함수를 활용하여 음성 콘텐츠와 화자 정보를 분리된 하위 공간으로 변환하여 화자 검증 및 키워드 검색 작업에서 성능을 향상시켰어요.