연구진은 AI 및 인간 창작물의 다양성을 측정하는 새로운 방법으로 'Decan' 지표를 제안했어요. 이 지표는 언어 모델의 in-context learning을 활용하여 다양한 유사성을 감지하고, 별도의 모델 훈련 없이 단일 순방향 패스만으로 평가합니다.
Decan 지표는 Tevet와 Berant의 McDiv 벤치마크에서 OCA 0.846을 기록하며, 인간이 작성한 응답 세트와 AI 샘플을 비교하는 데 사용돼요.
OLMo-2-7B 파이프라인에서 Decan 지표는 base → SFT → DPO → RLVR 단계별로 감소하며, 창작 쓰기 애플리케이션에서 중요하게 다루는 다양성 손실을 감지하는 데 효과적이에요.