Pulse · AI 뉴스

판단에서 과정으로: 다단계 사실 검증을 위한 에이전트 강화 학습

ProFact · 2026-06-11

연구진이 ProFact라는 에이전트 강화 학습 프레임워크를 제안했어요. ProFact는 LLM과 연동된 다단계 사실 검증 경로를 최적화하는 방식이에요.

ProFact는 청구 분해, 증거 수집, 답변 생성, 판정 예측을 조정하는 통합 정책을 학습해요. 최종 진실성 레이블의 희소한 감독 문제를 해결하기 위해 과정 인지 보상을 도입했어요.

실험 결과, ProFact는 검증 성능과 추론 효율성 모두에서 강력한 기준 모델을 능가하는 것으로 나타났어요.

##사실검증##강화학습##LLM##ProFact
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기