Pulse · AI 뉴스

SCRIBE: 음성 인식 진단 평가 및 풍부한 음성 기록 모델 공개 (힌디어, 말라얄람어, 칸나다어)

SCRIBE · 2026-05-20

SCRIBE는 음성 인식 오류 유형을 분해하여 힌디어, 말라얄람어, 칸나다어 음성 기록 모델을 공개했어요. 기존 WER 방식의 한계를 극복하기 위해 어휘, 구두점, 숫자, 도메인 엔티티 오류율을 분석하는 진단 프레임워크를 제시했어요. 사람의 판단과 일치하는 SCRIBE는 음성 인식 오류 분석에 새로운 기준을 제시할 것으로 보입니다.

SCRIBE는 음성 인식 오류를 분석하는 프레임워크로, 기존 WER 방식이 가진 문제점을 해결하기 위해 개발되었어요. 음성 인식 오류를 어휘, 구두점, 숫자, 도메인 엔티티 오류율로 세분화하여 분석하고, 힌디어, 말라얄람어, 칸나다어 음성 기록 모델을 함께 공개했어요.

SCRIBE는 LLM 기반의 음성 기록 모델 큐레이션 파이프라인과 벤치마크를 공개하며, 음성 인식 기술 발전에 기여할 것으로 기대돼요. 특히, 음성 인식 오류 분석에 대한 새로운 접근 방식을 제시하여 관련 연구에 도움이 될 것으로 보입니다.

##음성인식##SCRIBE##힌디어
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기