최신 LLM은 프롬프트 인젝션, 탈옥 등 공격에 취약하여 악의적인 프롬프트로 원래 지시를 덮어쓸 수 있어요. 연구진은 '지시 계층 구조'라는 새로운 훈련 기법을 개발하여 모델이 우선순위를 정하도록 했어요. 이 기법은 모델이 사용자 지시와 시스템 지시를 구별하고, 시스템 지시를 우선적으로 따르도록 훈련하여 보안성을 강화해요.