연구진은 ResNet, DenseNet, Vision Transformer 등 다양한 비전 모델의 크기와 복잡성이 설명 품질에 미치는 영향을 조사했어요. 11개의 모델을 분석한 결과, 모델 크기가 커진다고 해서 설명의 정확도가 항상 향상되는 것은 아니었어요.
특히 사전 학습 모델은 예측 성능은 높이지만, 설명의 지역화 정확도는 일관되게 증가하지 않는다는 사실이 확인되었어요. 모델 크기가 커져도 예측 성능은 좋지만, 실제 중요한 영역을 제대로 반영하지 못하는 경우도 발견되었어요.
결론적으로, 모델 선택 시 안전성이 중요한 경우, 예측 성능 외에 설명 품질을 명시적으로 평가해야 한다는 점을 강조했어요.