Pulse · AI 뉴스

Prisma-World: 카메라 제어 가능 멀티 에이전트 비디오 월드 모델

Prisma-World · 2026-06-08

Prisma-World는 여러 에이전트의 시점을 일관성 있게 생성하는 멀티 에이전트 비디오 월드 모델입니다. 이 모델은 에이전트의 시각적 경험을 생성할 때 장면의 일관성을 유지하는 데 중점을 둡니다.

Prisma-World는 에이전트의 시점을 하나의 시퀀스로 처리하고, RoPE 디자인을 사용하여 에이전트의 개성을 구별하면서도 시간 좌표를 동기화합니다.

모델은 또한 겹치는 시점을 공유된 장면 증거에 맞게 조정하기 위해 상대적인 카메라 지오메트리를 주의에 주입합니다. PrismaDataset이라는 대규모 UE5 데이터셋을 공개하여 멀티 에이전트 모델의 훈련과 평가를 지원합니다.

Prisma-World는 다양한 장면에서 유연한 에이전트 수, 카메라 제어, 향상된 교차 뷰 일관성 및 미니맵 가이드에 따른 공간적 기반을 갖춘 고품질 멀티 에이전트 비디오를 생성할 수 있습니다.

##멀티에이전트##비디오월드모델##Prisma-World##UE5##카메라제어
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기