연구진은 학생 오개념 분류의 어려움을 해결하기 위해 인지적 불확실성을 활용한 지식 증류 프레임워크를 제안했습니다. 이 방법은 기존 데이터에서 고가치 샘플을 추출하여 학습하며, 데이터 부족과 노이즈 문제를 해결합니다. 실험 결과, 전체 데이터의 10.3%에 불과한 샘플로도 기존 최고 성능 모델보다 높은 정확도를 달성했습니다.
MAP-Charting 데이터셋에서 MAP@3 지표가 17.8% 향상되었으며, 중학교 대수 오개념 벤치마크에서 4B 파라미터 모델로 84.38%의 정확도를 기록했습니다. 이는 기존 72B 모델(81.25%)을 능가하는 결과입니다.