대규모 시각-언어 모델(VLM)은 뛰어난 성능을 보이지만, 특히 전문 분야에서 사실 오류를 일으키는 경향이 있어요. 연구진은 모델이 알지 못하는 질문에 대한 거절 능력을 향상시키는 프레임워크를 제안했어요. Visual-Idk 데이터셋을 활용해 모델의 지식 경계를 명확히 하고, 진실성률을 57.9%에서 67.3%로 향상시켰어요.