연구진은 시각 언어 모델(VLM)의 신뢰성 예측에 대한 기존의 '주의-신뢰성 가정'을 검증했어요. 기존 가설은 시각적 정보에 대한 집중적인 주의가 모델의 신뢰성을 나타낸다고 주장하지만, 연구 결과는 그렇지 않다는 것을 보여줬어요.
연구진은 'VLM 신뢰성 탐침(VRP)'을 통해 다양한 모델의 시각적 인코더의 시선 패턴을 분석했고, '기호적 분리' 현상을 발견했는데, 이는 모델이 초기 시각적 특징을 고정하는 동시에 나중에 주의를 분산시키는 현상이에요.
시각적 주의 패턴과 정확도 사이에는 거의 상관관계가 없으며, 대신 자기 일관성(샘플링된 추론 경로 간의 일치율)이 진실 예측의 주요 지표로 나타났어요.
LLaVA는 예측을 취약한 후기 단계 병목 현상에 고정하는 반면, PaliGemma와 Qwen2-VL은 신뢰성을 전역적으로 분산시켜 상당 부분의 예측 레이어가 손상되어도 견고함을 유지해요.