연구진은 절차적 비디오 캡션의 사실성을 평가하는 DualFact라는 새로운 프레임워크를 소개했어요. DualFact는 개념적 사실과 문맥적 사실로 나누어, 추상적인 의미 역할과 비디오 내의 구체적인 관계를 모두 고려해요. YouCook3-Fact 및 CraftBench-Fact 데이터셋 실험 결과, 기존 모델은 유창하지만 사실적으로 불완전한 캡션을 생성하는 경향이 있음을 확인했어요.