Pulse · AI 뉴스

IHDec: 지시 계층을 보호하는 대비 디코딩을 통한 다중 턴 명령어 계층 보안

IHDec · 2026-06-29

연구진은 LLM이 다중 입력에서 역할 우선순위가 충돌할 때 지시 계층(IH)을 유지하지 못하는 문제점을 발견했습니다.

IHDec는 훈련 없이 다중 턴 환경에서 지시 계층 위반을 감지하고 대비 디코딩을 통해 잘못 정렬된 하위 역할을 억제하는 기술입니다.

실험 결과 IHDec는 기존 훈련 기반 방법보다 성능이 뛰어나고 안전성 강화 및 모델 확장 시너지 효과를 보였습니다.

##LLM##안전성##다중턴##계층구조##디코딩

매일 핵심 AI 소식을 한국어로, 빠르게