연구진은 장기적인 GUI 작업에서 효율적인 상태 관리를 위해 MementoGUI라는 새로운 에이전트 메모리 프레임워크를 선보였습니다.
MementoGUI는 MLLM 기반 GUI 에이전트에 MementoCore라는 학습 컨트롤러를 탑재하여 온라인 메모리 선택, 압축 및 검색을 지원합니다.
GUI-Odyssey, MM-Mind2Web, MementoGUI-Bench 벤치마크에서 기존 방식 대비 성능이 향상되었으며, 더 큰 MementoCore 백본은 메모리 기반 GUI 제어를 강화합니다.