연구진은 웹에 존재하는 다양한 절차적 지식을 활용하여 에이전트의 장기 과제 해결을 돕는 MMG2Skill 프레임워크를 제안했어요.
MMG2Skill은 실제 가이드를 에이전트가 실행 가능한 기술로 변환하고, 에이전트의 관찰 가능한 경로를 통해 기술을 지속적으로 개선하는 guide-to-skill 학습 문제를 해결해요.
연구진은 MMG2Skill 프레임워크를 통해 GUI 제어, 오픈 엔드 게임플레이, 전략 카드 게임 등 다양한 환경에서 기존 에이전트 대비 12.8~25.3% 성능 향상을 달성했어요.