Pulse · AI 뉴스

환각 감소를 위한 적응형 시각적 기반 텍스트 생성: 글로벌 맥락 vs. 로컬 디테일?

Qwen-VL · 2026-04-27

연구진은 Vision-Language Models(VLMs)의 시각적 환각 문제를 해결하기 위해 Positive-and-Negative Decoding(PND)이라는 새로운 프레임워크를 제시했어요.

PND는 시각적 정보를 과소평가하는 VLMs의 주의 집중 부족 문제를 해결하기 위해, 긍정적 경로와 부정적 경로를 통해 대비 학습을 진행해요.

POPE, MME, CHAIR 벤치마크에서 PND는 최대 6.5%의 정확도 향상을 보이며, 다양한 VLM 아키텍처에 효과적으로 적용돼요.

##VLM##시각적환각##텍스트생성##PND##LLaVA
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기