의료 영상 언어 모델이 흉부 엑스레이 정확도가 높다고 보고되지만, 모델이 실제로 이미지를 활용하는지 단정하기는 어렵습니다. 연구진은 이미지에 대한 의존성을 평가하는 인과적 감사(causal audit)를 개발하여, 텍스트만으로도 이미지 활용 모델과 유사한 성능을 보이는 경우도 확인했습니다. 감사 결과, 일부 모델은 이미지를 무시하거나 불안정하게 활용하며, 특정 상황에서만 이미지를 선택적으로 사용하는 것으로 나타났습니다.