Pulse · AI 뉴스

Lost at the End: 멀티모달 지식 기반 시각 질의응답에서의 우선순위 편향

Lost at the End · 2026-06-15

연구진은 멀티모달 지식 기반 시각 질의응답(KB-VQA) 시스템에서 정보 활용 위치 의존성을 조사했어요.

기존 텍스트 기반 LLM의 '중간 정보 손실' 현상과 달리, 멀티모달 KB-VQA에서는 처음에 제시된 정보가 더 중요하게 활용되는 '우선순위 편향'(Lost at the End)이 나타났어요.

3개의 오픈소스 VLM 리더와 2개의 KB-VQA 벤치마크를 활용한 실험 결과, 처음에 제시된 정보가 마지막 정보보다 16~26점 더 높은 성능을 보였으며, 이는 프롬프트 슬롯 0에 집중되는 경향 때문으로 분석됐어요.

##KB-VQA##멀티모달##우선순위편향##VLM
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기