연구진은 LLM 기반 터미널 에이전트의 학습 데이터 부족 문제를 해결하기 위해 Terminal-World 파이프라인을 개발했어요. 이 파이프라인은 에이전트 기술을 중심으로 작업 지시, 환경, 가이드 트레일러지를 공동으로 생성합니다.
Terminal-World는 에이전트 기술을 조합하여 다중 역할 및 교차 도메인 작업 합성을 지원하며, 5,723개의 학습 환경을 구축하고 다양한 벤치마크에서 기존 터미널 에이전트 모델을 능가하는 성능을 보여줬어요.
1.2%의 학습 데이터만 사용하고 Terminal-World-32B는 Nemotron-Terminal-32B를 Terminal-Bench 2.0에서 Pass@1 기준으로 4.5% 향상시켰으며, Pass@3은 43.8%를 달성했어요.