연구진은 시각 정보의 의존성을 고려하지 않은 기존 다중 모달 추론 방식의 한계를 지적했어요. MathVis-Fine 데이터셋을 구축하고, 시각적 의존성 수준에 따라 시각적 강화 보상을 점진적으로 조절하는 2단계 학습 패러다임을 제안했어요. MathVis-Fine 프레임워크는 시각적 의존성을 기반으로 시각적 인지 능력을 점진적으로 향상시켜 다중 모달 수학적 추론의 정확성을 높여요. 데이터셋은 채택 후 공개될 예정이에요.