연구진은 LLM이 학습에 활용될 때, 구조화되지 않은 대화 방식이 한계점을 드러낸다는 것을 확인했어요. 새로운 시스템은 학생의 사전 지식 그래프를 구축하고, 소크라테스식 대화를 통해 지식 습득을 돕는 방식으로, 튜터링 과정을 분리하여 효율성을 높였어요. STEM 및 비STEM 분야에서 실험 결과, PPO 기반 튜터가 기존 모델보다 학습 속도가 빠르고 대화 횟수를 줄이는 데 효과적이었어요.