연구진은 LLM 에이전트 검색 시스템의 과도한 검색 문제를 해결하기 위해 SAAS라는 새로운 강화 학습 프레임워크를 제안했어요. SAAS는 자기 인식 능력을 키워 불필요한 검색을 줄이고 정확도를 유지하는 데 목표를 두고 있어요. GitHub에서 코드를 익명으로 공개했습니다.
SAAS는 검색 경계 모델링, 경계 인식 보상 모듈, 단계별 최적화 전략의 세 가지 핵심 구성 요소를 도입하여 에이전트의 검색 행동을 정교하게 제어해요. 이를 통해 불필요한 검색을 억제하고 효율성을 높일 수 있어요.
실험 결과 SAAS는 과도한 검색을 크게 줄이면서도 정확도를 유지하는 것으로 나타났으며, 이는 LLM 에이전트 검색 시스템의 성능 향상에 기여할 것으로 기대돼요.