연구진이 RAG 시스템의 취약점을 악용한 데이터 포이즈닝 공격 'SilentRetrieval'을 개발했어요. 이 공격은 자연스러운 문장으로 조작된 문서를 삽입하여 LLM의 답변을 조작해요. 공격은 2단계로 진행되며, 1단계는 검색 가능성을 유지하면서 자연스러움을 보장하고, 2단계는 LLM을 활용하여 조작 트리거를 문서에 통합해요. 실험 결과, SilentRetrieval은 기존 공격 방식보다 훨씬 은밀하게 LLM의 답변을 조작할 수 있었어요.