연구진은 자율 주행 시나리오에서 Vision-Language 모델(VLM)의 안정성을 분석했어요. BDD100K 도로 장면을 기반으로, 이미지-텍스트 유사성에서 파생된 위험 점수의 변화를 예측하는 임베딩 드리프트와 마진 드리프트를 비교했어요. 특정 유형의 손상은 표현 드리프트와 의사 결정 드리프트 간의 강한 연관성을 보이지만, 다른 유형의 손상은 비교적 작은 임베딩 변화에도 불구하고 위험한 의사 결정 불안정을 유발해요.
대부분의 손상은 거짓 음성을 통해 위험 감지를 억제하지만, 가려짐은 거짓 경보를 유발하는 경향이 있어 벤치마크 설계 시 비대칭적 오류 모드를 고려해야 한다고 강조했어요. 임베딩 수준의 교란 통계 외에도 작업 연계 안정성 측정 기준을 포함하는 것이 중요하다고 제안했어요.