연구진은 LLM이 자기 글 수정 시 검증된 수정 지시를 얼마나 잘 따르는지 4개 모델을 대상으로 실험했어요. 실험 결과, LLM은 자기 글에 대한 검증된 수정 사항을 수용하거나 거부할 때, 자기 글쓴이로서가 아니든 새로운 모델로서가 아니든 거의 동일한 비율을 보였어요 (수정 거부율 차이 5.1%p). LLM이 자기 글 수정 사항을 거부하는 이유는 선호가 아닌 결함 발견이었으며, 이는 자기 글에 대한 비판적 사고 능력을 시사해요.