Pulse · AI 뉴스

Qwen3.5-Omni 기술 보고서: 256K 컨텍스트 길이, 100개 언어 지원

Alibaba · 2026-04-17

Qwen-Omni 모델 제품군 최신 모델인 Qwen3.5-Omni는 수백억 개의 파라미터를 사용하고 256K 컨텍스트 길이를 지원하며, 텍스트-비전 쌍과 오디오-비디오 콘텐츠를 활용하여 강력한 올바니모달리티 기능을 선보입니다.

Qwen3.5-Omni-plus는 215개의 오디오 및 오디오-비주얼 이해, 추론, 상호 작용 하위 작업 및 벤치마크에서 최고 수준의 결과를 달성하며, 특히 오디오 작업에서 Gemini-3.1 Pro를 능가하고 종합적인 오디오-비주얼 이해에서는 동등한 성능을 보입니다.

ARIA 기술을 통해 음성 합성의 안정성과 자연스러움을 개선하고, 10개 언어에서 인간과 유사한 감정적 뉘앙스를 지원하며, 오디오-비주얼 지침에 따른 코딩 기능을 새롭게 선보입니다.

##모델출시##오디오##멀티모달
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기