연구진은 시각 정보와 텍스트 정보를 함께 활용하는 딥 서치 에이전트의 성능을 향상시키기 위해 새로운 프레임워크인 ODE(On-policy Data Evolution)를 개발했어요.
ODE는 이미지 은행 참조 프로토콜을 기반으로 중간 시각 증거를 재사용할 수 있도록 하고, 에이전트의 진화하는 역량에 맞춰 데이터를 지속적으로 개선하는 방식을 사용해요.
8개의 멀티모달 딥 서치 벤치마크에서 ODE는 Qwen3-VL-8B 에이전트의 평균 성능을 24.9%에서 39.0%로 향상시켰으며, Gemini-2.5 Pro보다 뛰어난 결과를 보여줬어요.