연구진은 대형 시각 언어 모델(LVLM)의 신뢰성을 높이기 위해 흉부 X선(CXR) 추론 시 시각적 귀인 방법을 평가하는 새로운 평가 프레임워크를 개발했어요.
기존 귀인 방법은 LVLM이 사용하는 실제 시각적 증거를 제대로 식별하지 못하는 경우가 많다는 사실을 밝혀냈어요.
연구진은 개념 기반 귀인 방법인 MedFocus를 제안하여 해부학적 영역을 정확하게 찾아내고 모델 출력에 미치는 원인 효과를 측정하여 기존 방법보다 성능을 크게 향상시켰어요.