Pulse · AI 뉴스

롤링 버퍼 및 단일 언어 모델을 활용한 실시간 다국어 음성 인식

SpeechBrain · 2026-06-02

Gladia 연구팀이 실시간 다국어 음성 인식 시스템을 개발했어요. 이 시스템은 여러 개의 작은 단일 언어 모델을 활용해 대규모 다국어 모델의 한계를 극복했어요.

Zipformer, Silero VAD, SpeechBrain 기술을 결합해 저지연 스트리밍 번역과 언어 식별을 구현했어요. 음성 전환 시 오류가 발생할 수 있지만, 빠르게 자체 수정돼요.

인터 문장 코드 스위칭 벤치마크에서 ~13%의 WER을 달성했으며

##음성인식##다국어##실시간##SpeechBrain

매일 핵심 AI 소식을 한국어로, 빠르게