연구진은 MLLM의 시공간 추론 능력 부족 문제를 해결하기 위해 SpaMEM이라는 새로운 벤치마크를 개발했어요. SpaMEM은 1000만 장 이상의 이미지와 2만 5천 건 이상의 상호작용 시퀀스로 구성되어 있으며, 다양한 난이도의 15가지 진단 과제를 포함하고 있어요. 벤치마크 결과, 현재 MLLM은 시공간 정보를 정확하게 유지하는 데 어려움을 겪고 있으며, 특히 시각적 기억 능력 개선이 필요하다는 것을 확인했어요.