연구진이 sEMG와 입술 읽기를 결합한 무음 음성 합성 프레임워크를 제안했어요. 훈련 과정에서 모달리티 마스킹을 활용하여 단어 오류율을 최대 14%p 개선했어요. 저비트레이트 환경에서 성능 향상과 모달리티 부재 시 일반화 성능을 확인했어요. 모달리티 간 상호 보완적 기여를 보여주며, 특히 모음과 특정 자음군에 강점을 보였어요.