연구진은 시각 및 구조 복잡성을 고려한 다중 모드 테이블 추론 벤치마크인 TableVista를 발표했어요. TableVista는 3,000개의 문제로 구성되며, 다양한 시나리오 스타일과 시각적 변형을 통해 총 30,000개의 다중 모드 샘플을 제공합니다. 29개의 모델을 평가한 결과, 모델들은 구조적 복잡성과 시각적 통합이 결합될 때 추론 일관성을 유지하는 데 어려움을 겪는 것으로 나타났어요.