WorldReasoner는 언어 모델 에이전트의 타임라인 기반 예측 능력을 평가하는 새로운 프레임워크입니다. 에이전트가 주어진 날짜 이전의 정보만으로 미래 사건을 예측하고, 그 예측의 정확성, 근거, 인과 관계를 평가합니다. WorldReasoner는 345개의 해결된 과제를 포함하며, 8,087개의 추출된 사건을 다루는 그래프를 생성합니다. 실험 결과, 타임라인 기반 정보 검색이 예측 정확도를 높이는 가장 중요한 요소로 나타났습니다.