연구진은 복잡한 문제를 해결하기 위한 능동적인 검색, 증거 검증, 다단계 추론을 가능하게 하는 멀티모달 검색 에이전트의 재현 가능성을 높이기 위해 OpenSearch-VL 레시피를 공개했습니다.
OpenSearch-VL은 위키피디아 경로 샘플링, 퍼지 엔티티 재작성, 소스-앵커 시각적 정지 등 고품질 데이터 구축 파이프라인과 GRPO 훈련 알고리즘을 특징으로 합니다.
OpenSearch-VL은 7개의 벤치마크에서 평균 10점 이상의 성능 향상을 보여주며, 상업용 모델과 유사한 결과를 달성했습니다.