연구진이 다중 MRI 데이터의 복잡한 컨텍스트를 효과적으로 모델링하는 MICViT라는 3D 비전 트랜스포머를 제안했어요. MICViT는 모달리티별 로컬·전역 어텐션과 교차 모달 로컬·전역 어텐션을 결합하여 모달리티 간 상호작용을 포착해요. UK Biobank, SOOP, Cam-CAN 등 세 가지 데이터셋에서 CNN 및 트랜스포머 기반 모델을 능가하는 성능을 보였으며, 모달리티가 추가될수록 성능 향상 효과가 컸어요.