연구팀은 LLM 기반 자동 음성 인식(ASR) 모델이 종종 출력 언어를 잘못 식별하는 문제를 지적했어요. 이를 해결하기 위해, 모델이 특정 언어로 제한되지 않도록 '소프트 프롬프팅' 접근 방식을 제안했어요.
연구팀은 언어 준수 부족 문제를 정의하고, 이를 측정하는 새로운 지표를 도입했으며, 제로샷 프롬프팅, 지도 학습(SFT), Chain-of-Thought(CoT) 추론 등 3가지 해결 전략을 평가했어요.
다양한 언어에서 여러 전략을 비교 분석한 결과, 컴퓨팅 자원 제약 조건에 따른 전략 선택 가이드라인을 제시했어요.