Pulse · AI 뉴스

시각적 공격으로 비전-언어 모델의 안전 장벽 우회 가능성

Claude · 2026-05-01

연구진은 시각 모달리티를 악용한 4가지 새로운 jailbreak 공격 기법을 개발했습니다.

이 공격들은 Claude-Haiku-4.5에서 40.9%의 성공률을 기록하며 텍스트 기반 공격(10.7%)보다 효과적입니다.

연구 결과는 시각적 안전성 강화 없이는 VLM의 안전한 사용이 어렵다는 점을 시사합니다.

##VLM##jailbreak##시각적공격##안전
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기