Pulse · AI 뉴스

LLM 기반 정리표명 증명에서 감독 신뢰도 수준 재고: 세그먼트 수준 학습

Lean · 2026-05-12

연구진은 LLM 기반 정리표명 증명에서 감독 신뢰도 수준을 재검토하고 세그먼트 수준 학습이라는 새로운 전략을 제안했습니다.

세그먼트 수준 학습은 로컬로 일관성 있는 증명 세그먼트를 추출하여 정책 모델을 훈련하며, 추론 시에도 동일 전략을 활용하여 단계별 모델의 짧은 롤아웃을 촉진합니다.

실험 결과, 세그먼트 수준 감독으로 훈련된 모델은 기존의 단계별 및 전체 증명 기반 모델보다 높은 성공률을 보였습니다.

##LLM##정리표명##자동증명

매일 핵심 AI 소식을 한국어로, 빠르게