연구진은 LLM의 예측 능력과 정확성 사이에 역방향 상관관계가 있음을 확인했어요. 특히, 급격한 성장과 위험을 가진 시계열 데이터를 예측할 때 더 강력한 모델일수록 예측 정확도가 떨어지는 경향이 있어요.
ForecastBench-Sim, 합성된 전염병 데이터, 실제 COVID-19, 홍역, 주택 시장, 초인플레이션 데이터에서 유사한 패턴이 관찰됐으며, 상위 꼬리 예측 실패가 주요 원인으로 분석됐어요.
모델 규모와 추가 훈련이 모두 역방향 스케일링에 기여하며, 도메인 지식도 이 문제를 해결하지 못한다는 점이 확인돼요. LLM 예측 평가 시 상위 꼬리를 포함하는 정확도 측정이 필요해요.