대규모 비전-언어 모델(LVLM)은 환각 현상을 일으켜 이미지에 없는 시각적 세부 사항을 주장합니다.
환각 현상을 막기 위해 주장을 검증하고 근거가 없으면 회피하여 주장된 주장의 환각 비율을 증명 가능하게 제한할 수 있습니다.
예산 기반 준수 증거 획득(BCEA)은 회피 대신 추가 시각적 증거를 획득하여 회피를 줄이고 통계적 보장을 유지합니다.
BCEA는 POPE 벤치마크에서 환각 비율을 제어하고 보장된 회피 기준선보다 더 나은 커버리지를 제공합니다.