연구진은 기존 유해 영상 벤치마크의 한계를 지적하며 다층적인 유해 영상 이해를 위한 새로운 벤치마크 HarmVideoBench를 공개했어요.
HarmVideoBench는 관찰 가능한 증거, 클립 내부 의미, 클립 초월 추론의 세 가지 계층적 차원을 평가하며, 표면적인 단서 너머의 깊이 있는 이해를 목표로 합니다.
BCR(Benchmark-aligned Context Retrieval) 방법을 통해 모델 성능을 84.4%까지 끌어올렸으며, 이는 기존 모델 성능 61.7%를 크게 능가하는 수치예요.