LLM 에이전트가 정적 벤치마크에서는 능숙하지만, 실제 환경에서는 사용자 쿼리, 도구, 상호작용 변화에 취약합니다. 연구진은 이러한 격차를 해결하기 위해 OpenAgent라는 문제 설정을 정의하고, 환경 변화를 체계적으로 진단했습니다. SFT와 강화 학습으로 훈련된 에이전트는 환경 변화에 직면했을 때 성능 저하를 겪으며, Perturbation-Augmented Fine-Tuning을 통해 에이전트의 견고성과 유용성을 높일 수 있습니다.