Pulse · AI 뉴스

WorldReasoner: 언어 모델 에이전트의 타임라인 기반 예측 능력 평가

WorldReasoner · 2026-06-10

WorldReasoner는 언어 모델 에이전트의 타임라인 기반 예측 능력을 평가하는 새로운 프레임워크입니다. 에이전트가 주어진 날짜 이전의 정보만으로 미래 사건을 예측하고, 그 예측의 정확성, 근거, 인과 관계를 평가합니다. WorldReasoner는 345개의 해결된 과제를 포함하며, 8,087개의 추출된 사건을 다루는 그래프를 생성합니다. 실험 결과, 타임라인 기반 정보 검색이 예측 정확도를 높이는 가장 중요한 요소로 나타났습니다.

##에이전트##평가##예측##WorldReasoner##인과관계
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기