LLM 기반 에이전트가 환경 피드백과 추론을 결합하여 복잡한 작업을 해결하지만, 기존에는 각 에피소드가 고정된 컨텍스트에서 시작되어 유용한 전략이 사라지는 문제가 있었어요.
연구진은 경험을 메모리, 전략, 워크플로우, 스킬 4가지 유형으로 분류하고, 사용 결과를 바탕으로 점수를 매겨 라이브러리를 관리하는 UCE 프레임워크를 제안했어요.
UCE는 ALFWorld 성공률을 75.4%에서 96.3%, WebShop 점수를 45.1%에서 61.3%로 향상시켰으며, 축적된 라이브러리는 별도 훈련 없이 다른 에이전트에게도 적용 가능했어요.