연구진은 다중 모드 LLM이 지속적으로 변화하는 환경에 적응하면서 기존의 평가 지표가 답변의 정확성만 측정하고 근거의 안정성을 간과한다는 점을 지적했어요.
새로운 프레임워크인 \textsc{RCL}은 이전 체크포인트를 행동 기준으로 고정하고, 교사-학생 증거 의존도 프로필을 추정하여 작업 학습, 예측 보존, 의존성 보존을 동시에 최적화해요.
CoIN, COAST, MCITlib 데이터셋에서 \textsc{RCL}은 기존 방식보다 성능을 향상시키고 망각을 줄이며, 증거 의존도 변화, 주요 증거 전환, 숨겨진 망각 비율을 크게 낮췄어요.