연구진은 텍스트와 이미지를 활용한 테이블 학습 벤치마크 MulTaBench를 발표했습니다. 기존 벤치마크의 한계를 극복하기 위해 40개의 데이터셋을 구성했으며, 예측 성능 향상을 위해 타겟에 맞는 표현 학습의 중요성을 강조합니다.
MulTaBench는 의료, 전자상거래 등 다양한 분야의 고품질 데이터셋을 포함하며, 현재까지 가장 큰 규모의 이미지-테이블 벤치마크입니다.
실험 결과, 타겟에 맞는 표현 학습은 텍스트와 이미지 모달리티 모두에서 성능 향상을 가져왔으며, 다양한 모델과 인코더 크기에서도 일반화되는 것을 확인했습니다.