Pulse · AI 뉴스

PermaFrost-Attack: LLM 훈련 시 잠재적 논리 지뢰 심는 은밀한 사전 훈련 공격

arXiv cs.CL · 2026-04-24

연구진은 LLM 훈련 과정에서 악의적인 콘텐츠를 웹 크롤러에 노출시켜 미래 훈련 데이터에 침투시키는 새로운 공격 방식인 Stealth Pretraining Seeding (SPS)을 제안했어요.

SPS 공격은 개별 악성 콘텐츠가 작고 은밀하게 위장되어 있어 데이터 구축이나 필터링 과정에서 탐지하기 어려워 잠재적인 논리 지뢰를 심는 것과 같아요.

연구 결과, SPS는 다양한 모델에서 효과적으로 작동하며 안전 장치를 우회하는 지속적인 위험한 행동을 유발할 수 있다는 것을 보여줬어요.

##LLM##보안##공격##데이터포이즈닝##PermaFrost-Attack
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기