이 논문은 RUBEN이라는 대화형 도구를 소개하며, 이는 검색 증강 LLM(Retrieval-Augmented LLM)의 출력을 설명하는 최소한의 규칙을 발견하는 데 사용됩니다. RUBEN은 새로운 가지치기 전략을 활용하여 모든 다른 규칙을 포괄하는 최소한의 규칙 집합을 효율적으로 식별합니다. 연구진은 LLM 안전성을 테스트하고 적대적 프롬프트 주입의 효과를 검증하기 위해 이러한 규칙의 새로운 응용 분야를 보여줍니다.