Pulse · AI 뉴스

그래프 표현 학습 기반 LLM 연합 미세 조정 모델 조작 방어 전략

arXiv cs.LG · 2026-05-09

본 연구는 연합 미세 조정(FFT) 기반 LLM의 모델 조작 위협에 대응하기 위해 AugMP 전략을 제안합니다.

AugMP는 악성 업데이트의 효과와 은밀성을 높이기 위해 그래프 표현 학습 프레임워크와 반복적인 조작 알고리즘을 활용합니다.

실험 결과, AugMP는 기존 방법보다 강력한 조작 성능을 보이며, 글로벌 LLM 정확도를 최대 26% 감소시키고 로컬 LLM 정확도를 최대 22% 저하시켰습니다.

##LLM##연합학습##모델보안##그래프학습##미세조정

매일 핵심 AI 소식을 한국어로, 빠르게