연구진은 교육 평가에서 인간의 문제 난이도를 예측하는 새로운 방법인 Epi2Diff 프레임워크를 제시했어요. Epi2Diff는 LLM의 추론 과정을 인지적으로 해석 가능한 에피소드로 분해하여 문제 난이도를 예측하며, 기존 방법보다 뛰어난 성능을 보여요. 실험 결과, 더 어려운 문제는 더 많은 노력과 반복적인 과정을 필요로 하는 에피소드 역학을 보이며, 추론 모델을 활용한 교육 측정에 새로운 시각을 제공해요.