Pulse · AI 뉴스

AI 에이전트, 미래 예측 능력 평가: FutureBench

FutureBench · 2025-07-17

FutureBench는 AI 에이전트가 실제 세계의 사건(금리, 지정학)을 예측하는 능력을 평가하는 실시간 벤치마크입니다.

이 벤치마크는 데이터 유출 없이 실제 예측 능력을 측정하는 데 중점을 두고 설계되었습니다.

AI 에이전트의 미래 예측 능력을 통해 진정한 추론 능력을 파악할 수 있습니다.

##에이전트##벤치마크##미래예측
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기