연구진이 다양한 실시간 애플리케이션에 적용 가능한 범용 음성 향상 모델을 개발했어요. 이 모델은 알고리즘 지연과 계산 지연을 모두 제어할 수 있다는 특징을 가졌어요.
알고리즘 지연은 look-ahead 프레임 설정을 통해 유연하게 조정하고, 계산 지연은 early-exit 메커니즘을 통해 다양한 네트워크 깊이에서 추론할 수 있어요.
특정 지연 시간 모델과 범용 모델의 성능 격차를 줄이기 위해 공유-다중 디코더 전환 전략을 활용한 2단계 학습 방법을 사용했어요.