연구진은 모델의 유용성을 유지하면서 유해한 출력을 유발하는 파라미터를 제거하는 새로운 가지치기 프레임워크를 소개했어요. 이 방법은 기울기 기반이 아니어서 GPU 자원을 적게 사용하며, 다양한 모델 구조와 양자화 방식에 적용 가능해요. 실험 결과, 유해한 콘텐츠 생성량이 줄고 탈옥 공격에 대한 견고성이 향상되었으며, 모델 성능 저하가 최소화되었어요.