연구진이 지시 튜닝 없이 음성 언어 모델 SpeechCombine을 개발했어요. 30k 시간 분량의 음성 데이터로 사전 훈련을 진행했고, 텍스트 LLM 기반 모델과 결합했어요. 기존 방식보다 음성 데이터 의존성을 줄이는 새로운 훈련 방향을 제시했어요.