Pulse · AI 뉴스

시각 기반 멀티모달 딥 서치 에이전트의 온-정책 데이터 진화 연구

Qwen · 2026-05-12

연구진은 시각 정보와 텍스트 정보를 함께 활용하는 딥 서치 에이전트의 성능을 향상시키기 위해 새로운 프레임워크인 ODE(On-policy Data Evolution)를 개발했어요.

ODE는 이미지 은행 참조 프로토콜을 기반으로 중간 시각 증거를 재사용할 수 있도록 하고, 에이전트의 진화하는 역량에 맞춰 데이터를 지속적으로 개선하는 방식을 사용해요.

8개의 멀티모달 딥 서치 벤치마크에서 ODE는 Qwen3-VL-8B 에이전트의 평균 성능을 24.9%에서 39.0%로 향상시켰으며, Gemini-2.5 Pro보다 뛰어난 결과를 보여줬어요.

##멀티모달##에이전트##딥러닝

매일 핵심 AI 소식을 한국어로, 빠르게