연구진은 LLM의 무상태 모니터링을 악용하는 새로운 다중 턴 공격 기법인 '일시적 턴 인젝션(TTI)'을 소개했어요. TTI는 자동화된 공격 에이전트를 활용하여 LLM의 정책 시행을 반복적으로 테스트하고 우회하며, 기존의 탈옥 방식과는 차별화돼요. OpenAI, Anthropic, Google Gemini, Meta 등 다양한 LLM에 대한 평가 결과, 모델별로 TTI 공격에 대한 저항성이 크게 다르다는 것을 확인했어요.