엔비디아가 언어, 이미지, 영상, 음성 등 다양한 데이터를 통합 처리하고 생성하는 새로운 AI 모델 'Cosmos 3' 패밀리를 공개했어요. Cosmos 3는 기존 비전-언어 모델, 영상 생성기, 시뮬레이터, 액션 모델을 하나로 통합하여 물리 AI 분야의 새로운 가능성을 제시합니다. Cosmos 3는 Text-to-Image, Image-to-Video 모델 평가에서 최고 성능을 기록했으며, 관련 코드와 데이터셋은 오픈소스로 공개됐어요.