연구진은 프롬프트 주입 탐지 성능을 실제 운영 제약 조건 하에서 평가하기 위해 다중 모델 및 체제 실험 프레임워크를 사용했어요. 다양한 환경에서 탐지 모델을 비교한 결과, 탐지 성능은 체제에 따라 크게 달라지고 임계값 선택에 민감했어요. 트랜스포머 기반 모델이 가장 강력한 성능을 보였으며, 구조적 신호는 특정 체제에서 소폭이지만 꾸준한 성능 향상을 가져왔어요.