Anthropic이 아닌 MiniMax와 Qwen 모델을 기반으로 한 오픈 소스 에이전트 모델링 프레임워크 'Orchard'가 공개됐습니다.
Orchard는 환경 서비스 'Orchard Env'를 핵심으로 하며, SWE (코딩), GUI (컴퓨터 사용), 개인 비서 등 다양한 분야의 에이전트 모델링 레시피를 제공합니다.
Orchard-SWE는 SWE-bench에서 67.5% 정확도를 기록하며 오픈 소스 모델 중 최고 성능을 달성했고, GUI 모델은 WebVoyager에서 74.1% 성공률을 보였습니다.