Pulse · AI 뉴스

Starve to Perceive: 시각적 대역폭 제한으로 VLM의 게으른 시각적 인식 교정

Starve to Perceive · 2026-05-19

연구진은 Vision-Language Models (VLM)이 고해상도 환경에서 작동할 때 능동적인 시각적 인지가 중요하지만, 현재 학습 방식은 이러한 능동성을 제대로 학습하지 못하는 '게으른 시각적 인식' 현상을 야기한다고 밝혔습니다. Starve to Perceive라는 새로운 학습 패러다임을 통해 시각적 대역폭을 제한하여 모델이 능동적으로 탐색하도록 유도했습니다. 결과적으로 다양한 벤치마크에서 평균 5%의 성능 향상을 달성했습니다.

##VLM##시각적인지##능동적학습##StarveToPerceive
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기