DSGym은 LLM 기반 데이터 과학 에이전트의 평가 및 훈련을 위한 새로운 통합 프레임워크예요. 90개 이상의 생물정보학 작업, 92개의 Kaggle 대회, 그리고 합성 경로 생성 기능을 제공하며, 다양한 데이터 과학 시나리오를 지원해요. 40억 개의 파라미터로 구성된 DSGym 모델은 오픈 소스 모델 중 최고 수준의 성능을 달성했어요.