연구진은 LLM 에이전트의 장기 기억 질문 답변 성능 향상을 위해 DeferMem 프레임워크를 개발했어요. DeferMem은 쿼리 시간에 광범위한 후보를 검색하고, DistillPO 강화 학습 알고리즘을 활용해 쿼리에 최적화된 증거를 추출하는 방식이에요. LoCoMo 및 LongMemEval-S 벤치마크에서 기존 방식보다 QA 정확도와 메모리 시스템 효율성을 모두 개선하며 최고 성능을 달성했어요.