Pulse · AI 뉴스

시각적 추론을 위한 지각적 흐름 네트워크

arXiv cs.AI · 2026-05-05

연구진은 대규모 시각 언어 모델(LVLM)의 일반적인 최적화 목표가 시각적 경로를 제한하지 못해 언어 편향과 환각을 유발한다는 점에 주목했어요.

Perceptual Flow Network (PFlowNet)은 전문가 사전 지정에 엄격하게 맞추지 않고 해석 가능하면서도 효과적인 시각적 추론을 달성하는 방법을 제안합니다.

PFlowNet은 V* Bench에서 90.6%, MME-RealWorld-lite에서 67.0%라는 새로운 최고 기록을 세우며 성능을 입증했어요.

##시각적추론##LVLM##PFlowNet##강화학습
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기