Pulse · AI 뉴스

SCPRM: 지식 그래프 질의응답을 위한 스키마 기반 누적 과정 보상 모델

arXiv cs.AI · 2026-05-05

연구진은 대규모 언어 모델의 중간 단계를 평가하는 데 어려움이 있어 과정 보상 모델의 위험 보상 효과 문제를 해결하기 위해 스키마 기반 누적 과정 보상 모델(SCPRM)을 제안했습니다.

SCPRM은 추론 경로를 평가할 때 추론 접두사를 조건으로 하고, 질의에서 파싱된 암시적 대상과 현재 추론 단계 간의 스키마 거리를 통합하여 누적적이고 미래 지향적인 보상을 제공합니다.

SCPRM은 몬테카를로 트리 탐색(MCTS)과 통합되어 지식 그래프 질의응답(QA) 작업에서 평균 1.18%의 Hits@k 성능 향상을 보여주었습니다.

##모델출시##지식그래프##질의응답
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기