Pulse · AI 뉴스

텍스트-이미지 확산 모델의 멀티 컨셉 백도어 주입 안정화: 하이드라

Hydra · 2026-05-19

연구진은 오픈소스 재사용 및 파인튜닝 과정에서 숨겨진 백도어 공격에 취약한 텍스트-이미지 확산 모델의 문제를 지적했어요.

멀티 컨셉 백도어 주입 환경에서 개념 간 충돌이 발생해 기존 공격을 약화시킬 수 있다는 점을 발견했어요.

연구진은 하이드라(Hydra) 프레임워크를 제안하여 안정적인 멀티 컨셉 백도어 주입을 가능하게 하고, 8명의 공격자와 500개의 개념 쌍에서도 95%의 공격 성공률(ASR)을 유지했어요.

##백도어##확산모델##AI보안##머신러닝##텍스트-이미지

매일 핵심 AI 소식을 한국어로, 빠르게