최근 LVLM의 성능이 향상되었지만, 시각 정보와 관련 없는 환각 현상에 취약하다는 문제가 있어요. 연구 결과, 환각 현상은 주로 텍스트 우선순위와 배경 지식에 대한 과도한 의존에서 비롯되는 것으로 나타났어요. HalluVL-DPO 프레임워크를 통해 시각적으로 더 정확한 답변을 유도하고, 환각 현상을 완화하는 데 성공했어요.