연구진은 평생 개인 식별(LReID) 모델의 의미적 드리프트, 적응성 부족, 파국적 망각 문제를 해결하기 위해 PAD(Prompt-Anchored vision-text Distillation)라는 새로운 프레임워크를 제안했습니다. PAD는 비전과 텍스트를 분리하여 의미적 정렬과 도메인 간 일반화를 가능하게 합니다.
텍스트 측면에서는 고정된 텍스트 인코더를 활용하여 도메인 간 의미적 정렬을 유지하고, 비전 측면에서는 EMA 기반 교사 모델과 적응적 프롬프트 풀을 사용하여 도메인별 적응을 지원합니다.
실험 결과, PAD는 기존 최고 성능 모델보다 뛰어난 성능을 보였으며, 안정성과 가소성 간의 균형을 잘 유지했습니다. 프로젝트 페이지는 GitHub에서 확인할 수 있습니다.