연구진이 LLM 추출 공격을 방어하는 새로운 방법 '지식 함정(Knowledge Trap)'을 제안했어요. 공격을 유도하여 쓸모없는 지식에 쿼리 예산을 소모하도록 만드는 방식이에요. 의료 및 금융 분야 실험에서 기존 방어보다 사용자 성능 저하 없이 추출 공격을 효과적으로 줄이는 것으로 나타났어요.
지식 함정은 '꿀주머니 지식 그래프(HKG)'와 탐색 가이드로 구성되어, 공격자를 유도하여 제한된 쿼리 예산을 낭비하게 만들어요. 기존 방어 방식은 늦게 대응하거나 사용자 유용성을 떨어뜨리는 문제가 있었어요.
실험 결과, 지식 함정은 대체 모델 합의율을 평균 6.2% 감소시켰으며, 정당한 사용자 정확도는 유지했어요. 지식 공간 탐색 방어가 LLM 추출 공격 완화에 실용적인 방향임을 시사합니다.