Pulse · AI 뉴스

시각-언어 모델의 신뢰성 있는 추론 자동화를 위한 의사코드 기반 구조적 추론

PStar · 2026-05-19

연구진이 시각-언어 모델(VLM)의 환각 현상을 줄이고 신뢰성을 높이는 프레임워크 PStar를 제안했어요.

PStar는 추론 난이도를 평가하는 DFV를 활용해 적절한 추론 경로를 선택하고, 구조화된 의사코드 라이브러리를 사용해 단계별 추론을 수행해요.

실험 결과 PStar는 POPE에서 87.1%, MMStar에서 68.0%의 최고 점수를 기록하며 GPT-4V를 능가하는 성능을 보여줬어요.

##VLM##추론##환각##의사코드##자동화

매일 핵심 AI 소식을 한국어로, 빠르게