Pulse · AI 뉴스

EvalVerse: 전문가 검증 영상 생성 벤치마크

EvalVerse · 2026-05-22

연구진이 전문가 검증을 거친 영상 생성 벤치마크 'EvalVerse'를 공개했어요. 기존 벤치마크는 영상의 정확성만 평가했지만, EvalVerse는 영화적 품질, 연기, 미적 감각 등 '좋음'의 기준을 평가해요.

전문가 지식을 영화 제작 워크플로우에 맞춰 분류하고, VLMs에 주입해 체인 오브 소트 추론을 가능하게 했어요. 기존 벤치마크 대비 멀티샷 시퀀싱, 오디오·비주얼 통합 등 복잡한 작업 범위도 확장됐어요.

EvalVerse는 단순히 순위표를 넘어, 보상 모델과 평가 에이전트 개발을 위한 기반 인프라를 제공하며, 향후 영상 생성 연구 발전에 기여할 것으로 기대돼요.

##EvalVerse##영상생성##벤치마크##VLMs
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기