FlexiSLM은 음성 입력 및 출력을 위한 가변 프레임 속도를 지원하는 최초의 음성 언어 모델(SLM)입니다. 기존 SLM은 고정된 프레임 속도로 음성을 처리하지만, FlexiSLM은 음성의 시간 변화에 따른 정보 밀도를 활용합니다. FlexiSLM은 Qwen2.5-Omni, Kimi-Audio 등 기존 7B 모델보다 성능이 뛰어나며, 6.25Hz에서 추론 시간을 절반으로 줄이면서도 음성 품질을 유지합니다.