연구진이 대규모 비전-언어 모델(LVLM)의 효율적인 개인화를 위한 새로운 방법인 인컨텍스트 프롬프트 튜닝(ICPT)을 제안했어요. ICPT는 여러 참조 이미지에서 세밀한 시각적 의미를 추출하고, 이를 연속적인 프롬프트로 변환하는 경량화된 프로젝션 모듈을 사용해요. ICPT는 환경 편향과 개념 간 간섭을 줄이기 위해 새로운 기하학적 정규화 기법을 도입하여 다양한 작업과 LVLM 백본에서 최고 수준의 개인화 정확도를 달성했어요.