연구진은 LLM 에이전트의 장기적인 사용자 기억을 위한 새로운 시스템 MemCoE를 개발했어요. 이 시스템은 기억의 구성 방법과 업데이트할 정보를 학습하는 인지 기반 2단계 최적화 프레임워크를 사용합니다.
MemCoE는 먼저 Memory Guideline Induction을 통해 전역 지침을 최적화하고, Guideline-Aligned Memory Policy Optimization을 통해 지침을 따르는 기억 진화 정책을 학습해요.
세 가지 개인화 기억 벤치마크에서 기존 방식보다 성능이 향상되었으며, 안정성, 일반화 능력, 효율성 측면에서도 우수했어요.