연구진은 조형적 충실도 외에도 조화로운 색감과 영화 같은 조명 등 비디오 심미성을 향상시키는 새로운 프레임워크인 AesRM을 제안했어요.
AesRM은 시각 심미성, 시각 충실도, 시각적 타당성이라는 세 가지 핵심 차원으로 비디오 심미성을 분해하고, 15가지 세분화된 기준을 제시하여 전문가가 평가할 수 있도록 했어요.
AesRM은 기존 모델보다 여러 심미성 벤치마크에서 성능이 뛰어나고, 위치 편향이 낮아 더 안정적인 평가가 가능하며, Wan2.2 모델과 결합하여 심미성을 향상시키는 데 기여했어요.