RAG 시스템은 정확한 문단이 검색되었음에도 잘못된 답변을 할 수 있어요. 모델은 검색된 문단을 읽고 관련성이 높은 다른 문단들 중에서 정답이 담긴 문단을 찾아야 해요.
연구진은 의미 경쟁과 컨텍스트 길이를 분리하는 매칭 컨트롤 프로토콜을 도입했어요. 경쟁 문단을 덜 경쟁적인 문단으로 대체하여 Phi-2 모델의 EM 점수를 6.0점, 답변 포함률을 7.0점, F1 점수를 0.057 향상시켰어요.
연구 결과는 컨텍스트 길이와는 별개의 경쟁 효과가 존재하며, 스니펫 길이에 따라 그 효과가 달라짐을 보여줘요.