연구진은 LLM을 수학 튜터링에 활용하기 위해 훈련 대신 프롬프트 최적화만으로도 효과를 낼 수 있음을 확인했어요. 12가지 방법 중 ParetoGrad가 문제 해결률, 정보 유출 방지, 유용성 측면에서 균형 잡힌 성능을 보여줬고, 기존 RL 훈련 모델보다 뛰어났어요. 훈련 없이 프롬프트만으로 LLM 튜터 개발이 가능하며, 컴퓨팅 자원도 절약할 수 있다는 점이 주요 발견입니다.