Pulse · AI 뉴스

잠재 시각 추론 활용: Silence

Silence · 2026-05-19

연구진은 잠재 시각 추론이 추론 시에 반드시 필요한 요소인지 의문을 제기했어요. 실험 결과, 잠재 토큰을 무작위 노이즈로 대체하거나 제거해도 성능 저하가 미미했어요. 새로운 방법은 RL 보상을 통해 잠재 토큰이 후속 텍스트 토큰과 상호작용하도록 장려하여 시각적 근거와 텍스트 추론 정확도를 향상시켰어요.

잠재 시각 추론의 가치는 추론 시 형식이 아닌 학습을 안내하는 효과성으로 측정해야 한다는 주장이 제기됐어요. 연구 결과, 질문 유형에 따라 잠재 추론의 효과가 불균등하며, 잠재 생성 적용을 위한 경직된 작업 수준 라우팅은 취약했어요.

연구진은 잠재 시각 추론이 추론 시 명시적으로 표현되지 않더라도 시각적 근거를 개선하고 텍스트 추론 정확도를 높일 수 있음을 확인했어요. GitHub과 Hugging Face에서 코드와 학습 모델을 공개했어요.

##시각추론##잠재표현##강화학습##multimodal##HuggingFace
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기