웨어러블 기기에 통합된 대규모 다중 모드 모델(LMM)이 개인 비서로 진화하려면 개인의 시각적 정보를 활용하는 개인화된 시각적 맥락 학습(Personal VCL)이 중요합니다.
Personal-VCL-Bench 벤치마크를 통해 개인의 시각적 세계를 체계적으로 평가한 결과, 기존 LMM의 맥락 활용 능력 부족이 확인되었습니다.
Agentic Context Bank라는 새로운 접근 방식을 통해 개인의 시각적 맥락을 구조화하고, 표준 맥락 프롬프트 방식보다 성능을 향상시키는 결과를 얻었습니다.