Qwen-Omni 모델 제품군 최신 모델인 Qwen3.5-Omni는 수백억 개의 파라미터를 사용하고 256K 컨텍스트 길이를 지원하며, 텍스트-비전 쌍과 오디오-비디오 콘텐츠를 활용하여 강력한 올바니모달리티 기능을 선보입니다.
Qwen3.5-Omni-plus는 215개의 오디오 및 오디오-비주얼 이해, 추론, 상호 작용 하위 작업 및 벤치마크에서 최고 수준의 결과를 달성하며, 특히 오디오 작업에서 Gemini-3.1 Pro를 능가하고 종합적인 오디오-비주얼 이해에서는 동등한 성능을 보입니다.
ARIA 기술을 통해 음성 합성의 안정성과 자연스러움을 개선하고, 10개 언어에서 인간과 유사한 감정적 뉘앙스를 지원하며, 오디오-비주얼 지침에 따른 코딩 기능을 새롭게 선보입니다.