본 연구는 산발성 언어증 환자의 의사소통을 돕기 위해 Whisper 기반 ASR 모델을 개인화하는 방법을 제시합니다. TEQST 도구를 활용해 92시간의 음성 데이터를 수집하고, 모바일 앱을 통해 수집한 사용자 교정 데이터를 추가했습니다. LoRA 적응이나 Qwen3-ASR을 기반 모델로 사용한 것보다 Whisper를 기반으로 미세 조정하는 것이 더 효과적이었어요.
1.4시간의 적응 데이터만으로도 단어 오류율을 15.8%까지 줄였고, 22.5시간으로 10.7%, 모든 데이터를 사용했을 때 9.7%까지 개선됐습니다. 사용자 교정 데이터를 활용하는 것이 성능 향상에 중요한 역할을 했어요.
이 연구는 개인화된 미세 조정이 산발성 언어증 환자의 음성 인식 시스템을 실질적으로 유용하게 만들 수 있음을 보여줍니다.