연구진은 시각-언어 모델(VLM)을 활용한 히스토패톨로지 분야의 강건성 문제를 해결하기 위해 GAUC라는 새로운 코어셋 선택 방법을 제안했어요.
GAUC는 사전 학습된 멀티모달 임베딩 공간에서 작동하며, 데이터 분포 충실도, 프롬프트 재해석에 대한 성능 저하 방지, 과도한 자신감 억제라는 세 가지 목표를 동시에 최적화해요.
CRC-100K 및 MHIST 데이터셋에서 GAUC는 기존의 ICL 선택 방법과 데이터 증류 기반 모델보다 정확도, 교정, 프롬프트 강건성 측면에서 일관되게 개선된 결과를 보여줬어요.