연구진은 외부 스킬의 최적 사용량이 작업 및 단계에 따라 변동하는 점을 고려하여, 에이전트 강화 학습(RL)을 위한 동적 스킬 라이프사이클 관리 프레임워크인 SLIM을 제안했습니다.
SLIM은 정책 학습과 함께 외부 스킬의 가치를 최적화하며, 각 스킬의 기여도를 평가하여 유용한 스킬은 유지하고, 더 이상 필요 없는 스킬은 폐기하고, 새로운 스킬을 추가하는 방식으로 작동합니다.
실험 결과, SLIM은 ALFWorld 및 SearchQA에서 기존 방법보다 평균 7.1% 더 높은 성능을 보였으며, 일부 스킬은 정책에 통합되기도 하고 외부 가치를 유지하기도 했습니다.