FBK가 IWSLT 2026 Instruction Following 챌린지를 위한 SpeechLLMs를 개발했어요. 짧은 형식에서는 MCIF에서 SIFS 점수 2.0708을 기록하며 좋은 성능을 냈어요.
긴 형식에서는 세 가지 음성 분할 방법을 탐색하고 불안정한 긴 형식 생성을 고려한 HIFS 점수를 도입했어요.
실험 결과 30초 고정 분할이 가장 안정적인 성능을 보였으며, HIFS 점수 2.0663을 달성했어요. 긴 형식 생성을 통해 짧은 형식의 능력은 유지되는 것으로 나타났어요.