Pulse · AI 뉴스

보는 것이 학습이 아니다: 다중 모드 데이터의 무단 미세 조정으로부터 대규모 시각 언어 모델 보호

MMGuard · 2026-05-14

연구진은 LLM의 무단 학습을 막는 MMGuard를 제안했어요. MMGuard는 사람이 인지할 수 없는 노이즈를 주입하여 모델이 노이즈에 과적합되도록 만들어 성능을 저하시킵니다. 이론적 보장을 가진 교차 모드 바인딩 파괴를 통해 방어력을 강화하고, 9개의 오픈 소스 모델에서 효과를 검증했어요.

MMGuard는 데이터 소유자가 다중 모드 데이터를 무단으로 미세 조정하는 것을 사전에 보호할 수 있도록 설계되었으며, 기존의 사후 대응 방식과는 달리 적극적인 방어 전략을 사용합니다. 앙상블 학습 전략을 통해 다양한 모델에 대한 전송 가능성을 높여, 백박스, 회색 박스, 블랙박스 위협 모델 하에서 강력한 보호 성능을 보여줍니다.

MMGuard는 학습 손실을 최소화하여 모델이 노이즈에 과적합되도록 하는 최적화 단축로를 생성하며, 교차 모드 바인딩 파괴는 모델의 주의를 전략적으로 이동시켜 노이즈와 학습 목표 간의 가짜 상관관계를 강제합니다.

##LLM##보안##미세조정##MMGuard##데이터보호

매일 핵심 AI 소식을 한국어로, 빠르게

App Store 에서 Pulse 받기 앱에서 열기