연구진은 장기 대화 에이전트의 추론 능력을 향상시키기 위해 GRAVITY라는 새로운 구조적 메모리 모듈을 개발했습니다.
GRAVITY는 관계 그래프 기반 엔티티 프로필, 시계열 이벤트 튜플, 세션 간 주제 요약 등 다양한 지식 표현을 추출하여 언어 모델 프롬프트에 주입합니다.
LongMemEval 및 LoCoMo 벤치마크 평가 결과, GRAVITY는 LLM-judge 정확도를 평균 7.5~10.1% 향상시켰으며, 기존 시스템 성능에 따라 효과가 달라지는 것을 확인했습니다.