연구진은 다중 홉 질문 응답 시스템의 불필요한 리트리벌 비용 문제를 해결하기 위해 RASER(Recoverability-Aware Selective Escalation Router)를 제안했어요.
RASER는 단일 RAG(Retrieval-Augmented Generation)를 기반으로 6가지 특징을 활용하여 추가 리트리벌 여부를 결정하며, LLM 호출 없이 작동해요.
6가지 LLM과 3가지 다중 홉 QA 벤치마크에서 RASER는 기존 SOTA 모델과 비슷한 F1 점수를 유지하면서 토큰 사용량은 41~49% 수준으로 절감했어요.