연구진은 질문에 대한 답변 없이 전략 기반 지침을 유도하는 Strategy-Induct 프레임워크를 제안했어요. Strategy-Induct는 질문과 함께 명시적인 추론 전략을 생성하고, 이 전략들을 활용해 지침을 유도하는 방식이에요. 실험 결과, 기존 방법보다 질문 데이터만으로 더 나은 성능을 보여줬어요.
Strategy-Induct는 LLM과 Large Reasoning Model을 함께 활용해 지침 생성 및 추론 성능을 더욱 향상시킬 수 있다는 점을 확인했어요. 이는 답변 데이터 없이도 LLM 성능을 개선할 수 있는 가능성을 보여줘요.
연구진은 Strategy-Induct가 다양한 작업과 모델 규모에서 기존 방법보다 우수한 성능을 냈으며, 답변 데이터 없이도 LLM의 성능을 향상시킬 수 있음을 입증했어요.