연구진은 최근 ACL 2026 연구를 재현하고 3가지 새로운 실험을 추가하여 LLM 초안의 개인 스타일 수정 성능을 분석했습니다.
GPT-5.5와 Claude Opus 4.7은 324개의 작업에서 인간 편집자의 수준에 71~75%까지 좁히는 데 성공했으며, 인간 편집자보다 약 80%의 작업에서 더 나은 성능을 보였습니다.
연구진은 AI-텍스트 탐지 레이스라는 관점에서 데이터를 재구성하여, LUAR-MUD 임베딩을 사용한 선형 SVM이 높은 AUC를 달성했으며, Claude Opus의 탐지는 진정한 스타일 특징임을 확인했습니다.