Pulse · AI 뉴스

SHRED: 셀프 증류 기반 로짓 디모션을 통한 리테인-셋 없는 언러닝

SHRED · 2026-05-08

SHRED는 LLM에서 특정 정보를 삭제하는 언러닝 방법으로, 기존 방식처럼 유지해야 할 데이터 세트 없이도 모델 성능 저하 없이 정보 삭제가 가능합니다.

SHRED는 정보가 집중된 토큰을 식별하여 삭제하고, 일반적인 언어 능력과 관련된 토큰은 유지하는 방식으로 작동하며, 이를 통해 모델은 효율적으로 학습합니다.

실험 결과, SHRED는 기존 방식보다 뛰어난 성능을 보이며, 재학습 공격 및 멤버십 추론 공격에 강하며, 반복적인 언러닝 과정에서도 안정적인 성능을 유지합니다.

##언러닝##LLM##자기지도학습##SHRED
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기