데이터 분석가 Sam Vardhan Shekhawat가 Shapiro-Wilk 검정 등 수동 작업에 지쳐 통계 분석 자동화 파이프라인 'StatForge'를 개발했어요.
StatForge는 다양한 데이터 형식 로딩, 가정 검증, APA 형식 작성 기능을 제공하며, Karpathy의 200줄 GPT를 활용해 데이터셋과 대화할 수 있는 검색 시스템을 구축했어요.
StatForge는 벡터 DB 없이 데이터 행을 문서로 취급하여 관련 정보를 검색하고 Anthropic API 또는 자체 규칙 엔진을 통해 분석 결과를 제공합니다.