Pulse · AI 뉴스

IG-Search: 검색 증강 추론을 위한 단계별 정보 획득 보상 기법

Qwen · 2026-04-17

연구진은 검색 증강 추론을 위한 강화 학습 프레임워크인 IG-Search를 제안했어요. 이 기법은 검색 단계별로 정보 획득(IG)을 기반으로 보상을 제공하여 모델의 성능을 향상시킵니다.

IG-Search는 기존 방식의 trajectory-level reward의 한계를 극복하고, 각 검색 쿼리의 효과를 측정하여 모델의 신뢰도를 높이는 데 기여합니다.

Qwen2.5-3B 모델을 사용하여 7개의 QA 벤치마크에서 실험한 결과, IG-Search는 기존 방식보다 평균 EM 점수가 1.6점 향상되었으며, 특히 multi-hop 추론 작업에서 두드러진 성능 향상을 보였습니다.

##강화학습##검색증강##정보획득##Qwen
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기