연구자가 Gemini Flash 모델을 활용한 실험적 메모리 회수 시스템 LongMemEval에서 최상위 성능(96.4%)을 달성했습니다.
이 시스템은 에피소드 메모리 이론, 재구축적 회상, 시간적 맥락 모델 등 인지 과학 이론을 기반으로 설계되었습니다.
쿼리 분해, 시간적 중요도 점수, 일관성 재순위화가 주요 설계 요소이며, 다중 세션 질문에 대한 효과적인 답변을 위해 고안되었습니다.
연구팀은 96% 이상의 성능에서 평가 체계의 한계에 부딪혔으며, 데이터 불일치 문제를 발견하여 상류에 보고했습니다.