연구자가 프롬프트 주입 공격으로부터 모델을 보호하기 위한 방법으로 델리미터와 엄격한 프롬프트를 사용하는 방법을 테스트했습니다. 15개 모델에 대해 7가지 공격 유형을 사용, 6100건 이상의 테스트를 진행했습니다.
결과적으로, 델리미터와 엄격한 프롬프트를 함께 사용했을 때 제마 4의 방어율은 21.6%에서 100%로 크게 향상되었으며, 그로크, 제미니 2.5 플래시 모델도 유사한 효과를 보였습니다.
연구 결과, 모델에게 지시를 따르도록 짧고 단호하게 지시하는 것이 모델을 혼란스럽게 만드는 설명적인 프롬프트보다 더 효과적인 것으로 나타났습니다. 또한, 로컬 모델은 예상보다 훨씬 더 강력한 방어력을 보여주었습니다.