InterLV-Search는 텍스트와 이미지를 반복적으로 활용하여 검색을 개선하는 에이전트 검색 벤치마크입니다. 벤치마크는 2,061개 예제로 구성되며, 시각적 증거 탐색, 검색 제어, 오픈 웹 연계 검색 등 세 가지 난이도를 포함합니다. 현재 시스템은 50% 미만의 정확도를 보여주며, 시각적 증거 탐색, 검색 제어, 다중 모드 증거 통합에 어려움이 있습니다.