연구진이 LLM 기반 자동 퀀트 전략 백테스팅 벤치마크 'BacktestBench'를 공개했어요. 6백만 건의 실제 시장 데이터를 기반으로 1만 8천여 개의 질문-답변 쌍으로 구성돼 있어요. AutoBacktest라는 멀티 에이전트 기반 라인을 통해 자연어 전략을 백테스팅 가능한 코드로 변환하는 방식을 제시했어요.
BacktestBench는 퀀트 전략 백테스팅 자동화에 필요한 지표 계산, 티커 선택, 전략 선택, 파라미터 확인 등 4가지 작업 범주를 포함하고 있어요. 23개 LLM을 평가한 결과, Grounded Verification과 표준화된 지표 표현의 중요성을 확인했어요.