연구진이 의료 영상 품질 평가(MIQA)에 사용되는 Vision-Language Model(VLM)의 신뢰성을 검증했어요. MediMeta-C 데이터셋을 활용해 7가지 손상 유형과 5단계 심각도에서 VLM을 테스트했어요. 픽셀화는 OCT 영상에서 최대 34.4%까지 점수 감소를 유발했으며, 밝기 변화는 미미한 영향을 미쳤어요.
VLM의 임베딩 공간 변화와 텍스트 속성(전문가, 기관 등)이 점수에 미치는 영향을 분석한 결과, 기관의 명성은 점수를 17.15% 상승시키는 반면, 장비 노후화는 점수를 14.7% 하락시켰어요. InternVL-8B는 최대 95.62% 증가, MedGemma는 최대 37.7% 감소를 보였어요.
연구 결과, 현재 VLM은 의료 영상 품질 평가에 한계가 있으며, 개인 정보 보호를 위한 픽셀화 처리는 성능 저하를 야기하고, 텍스트 속성에 따른 점수 변화는 객관성 문제를 드러냈어요. 의료 영상 품질 평가에 VLM을 활용하려면 개인 정보 보호와 객관적인 품질 평가라는 상반된 요구 사항을 충족해야 해요.