FutureBench는 AI 에이전트가 실제 세계의 사건(금리, 지정학)을 예측하는 능력을 평가하는 실시간 벤치마크입니다. 이 벤치마크는 데이터 유출 없이 실제 예측 능력을 측정하는 데 중점을 두고 설계되었습니다. AI 에이전트의 미래 예측 능력을 통해 진정한 추론 능력을 파악할 수 있습니다.