연구진은 BRIGHT-Pro라는 새로운 벤치마크를 도입하여 기존 BRIGHT의 한계를 극복하고, 다각적 증거를 평가하는 에이전트 검색 프로토콜을 지원합니다.
RTriever-Synth라는 새로운 합성 코퍼스를 구축하여 상호 보완적인 긍정 데이터를 생성하고, 긍정 조건부 하드 네거티브를 활용하여 모델을 학습시켰습니다.
실험 결과, 측면 인식 및 에이전트 검색 평가가 표준 지표로 파악하기 어려운 모델의 행동을 드러내며, RTriever-4B가 기반 모델보다 성능이 크게 향상되었습니다.