연구진은 메타 에이전트의 작업을 대상 에이전트 함수로 공식화하는 함수형 프로그래밍 모델인 Shepherd를 소개했습니다.
Shepherd는 모든 에이전트-환경 상호 작용을 타입화된 이벤트로 기록하여 Git과 유사한 실행 추적을 생성하고, 과거 상태를 포크하여 재실행할 수 있도록 합니다.
실시간 개입, 가상 실험 최적화, 트리-RL 훈련 등 세 가지 애플리케이션을 통해 Shepherd는 성능 향상과 시간 단축을 달성했으며, 시스템을 오픈 소스로 공개했습니다.