Pulse · AI 뉴스

Physics Question Scene Graph: 텍스트-비디오 생성 시 물리적 타당성 평가

Sora 2 · 2026-06-24

연구진이 텍스트-비디오 생성 모델의 물리 법칙 준수 여부를 평가하는 Physics Question Scene Graph (PQSG) 파이프라인을 공개했어요.

PQSG는 VLM을 활용해 객체, 동작, 물리 법칙 준수 여부에 대한 질문 그래프를 생성하고, 이를 통해 비디오의 물리적 타당성을 평가해요.

FinePhyEval 데이터셋을 통해 PQSG의 정확성을 검증한 결과, 기존 방식보다 인간 평가와 높은 상관관계를 보였고, Sora 2, Veo 3, Wan 2.1 모델 순위를 매겼어요.

##텍스트-비디오##물리적타당성##평가##Sora2##Veo3
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기