Gladia 연구팀이 실시간 다국어 음성 인식 시스템을 개발했어요. 이 시스템은 여러 개의 작은 단일 언어 모델을 활용해 대규모 다국어 모델의 한계를 극복했어요. Zipformer, Silero VAD, SpeechBrain 기술을 결합해 저지연 스트리밍 번역과 언어 식별을 구현했어요. 음성 전환 시 오류가 발생할 수 있지만, 빠르게 자체 수정돼요. 인터 문장 코드 스위칭 벤치마크에서 ~13%의 WER을 달성했으며