연구진은 LLM 지우개 학습 방법인 반사실 튜닝(CFT)이 기존 방식보다 성능이 떨어지는 이유를 분석했어요. 주요 원인은 반사실 데이터 내 지식 충돌과 가짜 정보 학습으로 인한 환각 증가라는 점이 밝혀졌어요. 새로운 벤치마크 RWKU+를 통해 문제점을 진단하고, LLM 지우개 학습 연구에 대한 통찰력을 제공해요.
반사실 데이터 내 지식 충돌은 최적화 과정에서 혼란을 야기하고, 가짜 정보 학습은 환각 발생률을 높여 관련 없는 분야에도 영향을 미쳐요. 연구진은 RWKU+ 벤치마크를 통해 이러한 문제점을 체계적으로 진단했어요.
연구 결과는 LLM 지우개 학습의 한계와 과제를 제시하며, 보다 엄격한 연구를 위한 지침을 제공합니다.