연구진이 다양한 작업 유형과 데이터 규모를 지원하는 통합 벤치마크 BeyondArena를 공개했어요.
BeyondArena는 IID, 시계열, 그룹화된 데이터 등 다양한 유형의 표 데이터를 평가하며, 데이터 주조(Data Foundry) 프레임워크를 통해 데이터 큐레이션을 지원해요.
11개 모델과 142개 데이터셋을 평가한 결과, 기존 표 기반 모델은 작은 IID 데이터에서 뛰어난 성능을 보이지만, 비-IID, 대규모, 고차원 데이터에서는 기존 트리 기반 및 딥러닝 모델이 우위를 점하는 것으로 나타났어요.