Pulse · AI 뉴스

지시 계층 구조: LLM이 우선순위를 정하도록 훈련하는 방법

OpenAI · 2024-04-20

최신 LLM은 프롬프트 인젝션, 탈옥 등 공격에 취약하여 악의적인 프롬프트로 원래 지시를 덮어쓸 수 있어요.

연구진은 '지시 계층 구조'라는 새로운 훈련 기법을 개발하여 모델이 우선순위를 정하도록 했어요.

이 기법은 모델이 사용자 지시와 시스템 지시를 구별하고, 시스템 지시를 우선적으로 따르도록 훈련하여 보안성을 강화해요.

##모델보안##프롬프트인젝션##훈련기법

매일 핵심 AI 소식을 한국어로, 빠르게