Pulse · AI 뉴스

단일 토큰으로 다중 모드 증거 활용: 자원 제약 QA를 위한 잠재 기억

Latent Memory · 2026-06-09

연구진은 LLM·VLM 기반 QA의 토큰 소비 및 저장 부담을 줄이기 위해 잠재 기억(Latent Memory)이라는 새로운 패러다임을 제안했어요.

잠재 기억은 원본 텍스트/이미지 증거를 작은 크기의 LLM/VLM으로 압축해 단일 고차원 잠재 토큰으로 대체하는 방식이에요.

이 방식은 기존 RAG 대비 3~10배 적은 토큰을 사용하면서도 경쟁력 있는 QA 성능을 달성하며, WebQA에서 가장 뛰어난 이미지 기반 QA 성능을 보여줬어요.

##LLM##VLM##QA##RAG##잠재기억

매일 핵심 AI 소식을 한국어로, 빠르게