연구진은 시각-언어 모델(LVLM)이 이미지 정보 없이도 언어적 선입견에 따라 답변을 생성하는 '시각적 무근거성' 문제를 지적했습니다.
BICR(Blind-Image Contrastive Ranking)은 실제 이미지와 검은색으로 처리된 이미지를 활용하여 모델의 숨겨진 상태를 비교 분석하는 새로운 신뢰도 측정 프레임워크입니다.
BICR은 5가지 LVLM과 7가지 기존 방법론을 평가하여 교정 및 구별 성능 모두에서 가장 우수한 결과를 보였으며, 기존 방법보다 훨씬 적은 파라미터로 통계적으로 유의미한 성능 향상을 달성했습니다.