ClawGym은 클로 스타일 개인 에이전트 개발의 전체 라이프사이클을 지원하는 확장 가능한 프레임워크예요.
ClawGym-SynData는 13,500개의 필터링된 작업 데이터셋으로, 페르소나 기반 의도와 기술 기반 운영을 통해 합성되었고, 현실적인 모의 작업 공간과 하이브리드 검증 메커니즘을 포함하고 있어요.
ClawGym-Bench는 자동 필터링과 인간-LLM 검토를 통해 교정된 200개의 인스턴트 벤치마크로, 에이전트의 신뢰성 있는 평가를 지원해요.