Pulse · AI 뉴스

어떻게 풀어야 할지 결정하기 전에 무엇을 풀어야 할지 알기: 사전 계획을 통해 LLM의 수학적 추론 강화

PPC · 2026-05-29

연구진은 LLM의 수학적 추론 성능을 높이는 PPC(Preplan-Plan-CoT) 프레임워크를 제안했어요. PPC는 문제 이해 단계를 추가하여 기존 계획-실행 방식의 한계를 극복하고, 새로운 질문→사전 계획→계획→CoT 패러다임을 제시합니다.

사전 계획의 개념적 일관성을 유지하기 위해, 연구진은 스포일러-스코어 감지기를 활용한 3단계 합성 파이프라인을 설계하고, GRPO 보상을 통해 계획이 사전 계획을 따르도록 했습니다.

4개의 백본과 5개의 수학적 추론 벤치마크에서 실험한 결과, PPC는 40개 지표 중 39개에서 가장 좋은 성능을 보였으며, maj@16과 pass@16을 각각 +2.23, +3.06 향상시켰습니다.

##LLM##수학적추론##PPC##사전계획##CoT

매일 핵심 AI 소식을 한국어로, 빠르게