GPTZero와 Pangram 평가 결과, 기반 모델이 생성한 텍스트는 종종 인간 텍스트로 판단되는 반면, instruction-tuning된 모델은 그렇지 않다는 사실이 밝혀졌어요.
연구진은 이를 바탕으로 HIP(Humanization by Iterative Paraphrasing)라는 새로운 파이프라인을 제안하여, 기반 모델을 최소한으로 fine-tuning하여 paraphraser로 만들고 반복적으로 적용했어요.
HIP는 상업용 탐지기에서 의미 보존과 탐지 회피 간 균형을 개선하며, Llama-3와 Qwen-3 모델군 전반에서 탐지기 인간 유사성을 향상시켰습니다.