Pulse · AI 뉴스

EDIT: 증거 기반 진단 개입 훈련을 통한 규칙 준수 LLM 채점

EDIT · 2026-06-05

연구진은 채점 기준에 따른 정확한 점수 예측 외에도, 각 판단이 학생 답변의 증거에 근거해야 한다고 강조했어요. 기존의 자기 포함적 추론 작업에 맞춰 설계된 방법은 채점 추론 오류 지점을 파악하거나 모델의 최종 점수에 대한 믿음 변화를 추적하지 못해 어려움을 겪어요.

연구진은 두 단계 프레임워크인 EDIT(Evidence-Diagnosed Intervention Training)를 제안했어요. EDIT는 내부 모델 신호(최종 점수에 대한 사후 믿음, 입력-접지 점수)를 활용해 문제 있는 추론 단계를 찾아내고, 채점 기준 체크리스트를 활용해 해당 단계를 수정합니다.

두 가지 실제 다중 과목 채점 벤치마크 실험 결과, EDIT는 강력한 감독 학습 및 강화 학습 기준을 능가했으며, 내부 상태 진단이 이러한 성과 향상에 기여하는 것을 확인했어요.

##LLM##채점##강화학습##교육##연구
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기