연구진이 시각-언어 모델(VLM)의 환각 현상을 줄이고 신뢰성을 높이는 프레임워크 PStar를 제안했어요. PStar는 추론 난이도를 평가하는 DFV를 활용해 적절한 추론 경로를 선택하고, 구조화된 의사코드 라이브러리를 사용해 단계별 추론을 수행해요. 실험 결과 PStar는 POPE에서 87.1%, MMStar에서 68.0%의 최고 점수를 기록하며 GPT-4V를 능가하는 성능을 보여줬어요.