TVIR은 텍스트와 시각 요소를 결합한 심층 연구 보고서 생성 벤치마크와 에이전트 프레임워크입니다. 기존 벤치마크의 한계를 극복하기 위해 전문가가 큐레이션한 100개의 멀티모달 연구 과제를 포함합니다.
TVIR-Agent는 개요 작성, 이미지 검색, 출처 추적 차트 생성, 문맥에 맞는 순차적 작성 등 다단계 작업을 수행하는 계층적 멀티 에이전트 프레임워크입니다.
TVIR은 텍스트 평가와 시각 평가를 결합한 이중 경로 평가 프레임워크를 통해 심층 연구 시스템의 성능을 평가하고, 명시적인 멀티모달 설계의 중요성을 강조합니다.