FCMBench-Video는 금융 신용 검토, 온보딩, 원격 확인 등에서 중요한 문서 비디오 지능을 평가하는 새로운 벤치마크입니다. 이 벤치마크는 495개의 원자 클립으로 구성된 1,200개의 장편 비디오와 11,322개의 전문가 주석 질문-답변 인스턴스를 포함합니다. 9개의 최신 비디오-MLLM 평가 결과, FCMBench-Video는 시스템과 기능 간의 의미 있는 차이를 제공하며, 문서 비디오 이해 분야의 발전을 추적하는 데 유용합니다.