연구진은 다중 모달 대규모 언어 모델의 공간 지능을 평가하는 새로운 벤치마크인 GSI-Bench를 발표했어요. GSI-Bench는 실제 데이터셋(GSI-Real)과 합성 데이터셋(GSI-Syn)으로 구성되어 있으며, 공간적 제약 조건을 따르고 조작하는 모델의 능력을 측정하고 개선하는 데 사용돼요. GSI-Syn으로 모델을 미세 조정하면 공간 이해 능력 향상과 더불어 실제 작업에서도 성능이 향상되는 것을 확인했어요.