연구진은 LLM 기반 에이전트가 실제 환경에서 성능 저하를 겪는 문제를 지적했어요. 이를 해결하기 위해 환경 불완전성을 학습 과정에 통합하는 NoisyAgent 프레임워크를 제안했어요. 사용자 노이즈와 도구 노이즈를 시뮬레이션하여 훈련 환경을 개선하고, 점진적으로 난이도를 높여 에이전트의 강건성을 향상시켰어요.
NoisyAgent는 이상적인 벤치마크에서도 성능 향상을 보여, 환경 노이즈에 대한 노출이 일반화된 추론과 의사 결정을 촉진하는 것을 시사해요. 연구 결과는 에이전트 훈련과 실제 배포 간의 격차를 줄이기 위해 상호 작용 불완전성을 모델링하는 것의 중요성을 강조해요.
NoisyAgent는 사용자 상호 작용 패턴을 수정하고 도구 실행 결과를 시뮬레이션하여 훈련 파이프라인에 노이즈를 추가하는 방식으로 작동해요. 노이즈는 일부 롤아웃에만 적용되며 모델이 현재 노이즈 수준에 적응함에 따라 점진적으로 난이도가 증가해요.