연구진은 LLM이 다중 입력에서 역할 우선순위가 충돌할 때 지시 계층(IH)을 유지하지 못하는 문제점을 발견했습니다. IHDec는 훈련 없이 다중 턴 환경에서 지시 계층 위반을 감지하고 대비 디코딩을 통해 잘못 정렬된 하위 역할을 억제하는 기술입니다. 실험 결과 IHDec는 기존 훈련 기반 방법보다 성능이 뛰어나고 안전성 강화 및 모델 확장 시너지 효과를 보였습니다.