연구진은 음성 LLM(SLM)과 텍스트 LLM(TLM) 간의 간극이 여전히 크다는 문제점을 지적하며, 입력 측면에서 해결책을 제시했어요. TextPro-SLM은 WhisperPro를 활용해 음성 입력을 텍스트 LLM과 유사하게 만들고, 파라언어적 이해 능력을 향상시키는 모델이에요. 1,000시간의 LLM 학습 오디오만으로도 기존 SLM보다 간극을 줄이고 성능을 개선할 수 있었으며, 데이터 효율성도 높았어요.