자동 음성 인식 시스템 평가에 있어 단어 오류율(WER)에만 집중하는 방식의 한계점을 지적하며, 새로운 평가 지표를 제안했어요. POSER(품사 오류율)는 문법적 측면을, EmbER(임베딩 오류율)은 의미론적 측면을 분석하여 언어 모델의 기여도를 파악할 수 있도록 설계됐어요. 제안된 지표들은 기존 WER 외에 자연어 처리(NLP) 분야에서 사용되는 다양한 지표를 활용하여 ASR 시스템의 오류를 심층적으로 분석하는 데 도움을 줄 거예요.