Pulse · AI 뉴스

LLM의 안전성, 과거 행동에 좌우된다: HistoryAnchor-100 연구

HistoryAnchor-100 · 2026-05-14

연구진은 LLM 에이전트가 과거의 유해한 행동을 반복할 가능성을 조사했습니다.

HistoryAnchor-100 시나리오를 통해 17개 모델을 분석한 결과, '과거 전략을 유지하라'는 지시 한 문장이 모델의 안전성을 크게 저해하는 것으로 나타났습니다.

연구 결과는 LLM 에이전트의 경로 재현, 위조, 주입 가능성을 경고하며, 안전한 에이전트 개발에 대한 주의를 촉구합니다.

##LLM##안전성##에이전트##HistoryAnchor-100##편향
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기