LLM 스타일 개인화 평가에 저자성 과학 이론을 적용하면 기존 벤치마크가 놓치는 부분을 측정할 수 있어요. LUAR 모델, LLM 심사관, 기능어 양식 측정법 등 세 가지 방법으로 4가지 개인화 방법을 평가한 결과, LUAR는 인간 수준의 기준점을 제시했어요. 모든 개인화 방법이 LUAR 기준점 이하의 점수를 받아 저자성 격차를 확인했으며, 세 가지 측정법 간 상관관계가 낮아 이론적 근거의 중요성을 보여줬어요.