사용자(34BOE777)는 페이퍼 트레이딩/의사결정 지원 프로젝트에서 ML 도입을 신중하게 미루고 있습니다. 데이터 신뢰성과 백테스팅 파이프라인 구축을 우선하며, ML은 마지막 단계로 계획하고 있습니다.
데이터 수집, 저장, 백테스팅, 데이터 자동화 단계를 거쳐 LightGBMClassifier 모델을 활용해 스프레드, 세금, 수수료를 고려한 종목의 수익성을 예측하는 것을 목표로 합니다.
사용자는 시간 시리즈 데이터의 랜덤 분할 방지, 걷어온 검증(walk-forward validation) 사용 등 데이터 누수 방지를 위한 규칙을 고려하고 있으며, ML 모델은 자문 역할만 수행하도록 설계할 계획입니다.