Pulse · AI 뉴스

Cosmos 3: 언어·이미지·영상·음성 통합 AI 모델 공개

Cosmos 3 · 2026-06-01

엔비디아가 언어, 이미지, 영상, 음성 등 다양한 데이터를 통합 처리하고 생성하는 새로운 AI 모델 'Cosmos 3' 패밀리를 공개했어요.

Cosmos 3는 기존 비전-언어 모델, 영상 생성기, 시뮬레이터, 액션 모델을 하나로 통합하여 물리 AI 분야의 새로운 가능성을 제시합니다.

Cosmos 3는 Text-to-Image, Image-to-Video 모델 평가에서 최고 성능을 기록했으며, 관련 코드와 데이터셋은 오픈소스로 공개됐어요.

##AI모델##Omnimodal##PhysicalAI##엔비디아
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기