GPTZero와 Pangram 평가 결과, 기반 모델이 생성한 텍스트는 종종 인간 텍스트로 판단되지만, instruction-tuned 모델이 생성한 텍스트는 그렇지 않다는 사실이 밝혀졌어요.
연구진은 이를 바탕으로 Humanization by Iterative Paraphrasing (HIP) 파이프라인을 제안했는데, 이는 기반 모델을 최소한으로 fine-tuning하여 paraphraser로 만들고 반복적으로 적용하는 방식이에요.
HIP는 상업용 탐지기에서 의미 보존과 탐지 회피 간 균형을 개선하며, Llama-3와 Qwen-3 모델군 전반에서 탐지기 인간 유사성을 향상시켰어요.