Pulse · AI 뉴스

InstantForget: 백도어 제거를 위한 추론 시간 기능 재설정

InstantForget · 2026-06-14

연구진은 백도어 공격으로 심어진 악성 트리거를 제거하면서 모델의 정상적인 성능을 유지하는 ‘업데이트 없는 추론 시간’ 방식을 연구했어요.

기존 방식의 한계를 분석한 결과, 특정 조건에서 트리거 제거가 제대로 이루어지지 않는다는 것을 발견하고, 악성 기능을 가진 특징을 식별하여 정상적인 상태로 재설정하는 ‘InstantForget’ 기법을 제안했어요.

InstantForget은 CIFAR-10 데이터셋에서 평균 공격 성공률을 0.071%까지 낮추고, 98.1%의 탐지 정확도를 달성하며 다양한 모델 구조에 적용 가능성을 확인했어요.

##백도어##보안##머신러닝##InstantForget
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기