연구에서는 Chain-of-Thought (CoT) 지도 하에 여러 사고방식을 활용하여 학습하는 방법을 연구해요. CoT 지도 하에 학습하기 어려운 문제 유형도 있지만, 여러 사고방식의 CoT 지도 하에 학습하기 어려운 경우가 있다는 것을 밝혀냈어요. 적은 양의 CoT 데이터와 충분한 수동 데이터만으로도 목표 정확도를 달성할 수 있는 효율적인 능동 학습 알고리즘을 제시했어요.