연구진은 LLM·VLM 기반 QA의 토큰 소비 및 저장 부담을 줄이기 위해 잠재 기억(Latent Memory)이라는 새로운 패러다임을 제안했어요. 잠재 기억은 원본 텍스트/이미지 증거를 작은 크기의 LLM/VLM으로 압축해 단일 고차원 잠재 토큰으로 대체하는 방식이에요. 이 방식은 기존 RAG 대비 3~10배 적은 토큰을 사용하면서도 경쟁력 있는 QA 성능을 달성하며, WebQA에서 가장 뛰어난 이미지 기반 QA 성능을 보여줬어요.