연구진은 모델의 추론 과정을 이미지 영역과 연결하는 '시각적 근거 기반 추론' 방식을 제안했어요. Gemma 3.4B-IT 모델에 시각적 근거 기반 추론을 적용해 두 가지 계산 벤치마크와 네 가지 공간 추론 벤치마크에서 성능이 향상됐어요. 시각적 근거 기반 추론은 모델이 언어적 사고와 함께 이미지 영역을 명시적으로 지칭하도록 하여 추론 과정을 검증하고 감독하기 쉽게 만들어요.