연구진은 장기 GUI 작업에서 효율적인 상태 관리를 위해 MementoGUI라는 플러그인 에이전트 메모리 프레임워크를 개발했어요.
MementoGUI는 MLLM 기반 GUI 에이전트에 MementoCore를 탑재하여 온라인 메모리 선택, 압축, 검색을 지원하며, 텍스트 요약과 ROI 레벨의 시각적 증거를 보존해요.
GUI-Odyssey, MM-Mind2Web, MementoGUI-Bench 실험 결과, MementoGUI는 기존 방식 대비 GUI 에이전트의 성능을 향상시켰으며, 더 큰 MementoCore 백본은 메모리 기반 GUI 제어를 강화했어요.