연구진은 3D 의료 영상에서 훈련 데이터 없이 이상 감지를 수행하는 CS3F 프레임워크를 제안했어요. CS3F는 각 볼륨을 해부학적 축을 따라 분해하고 2D 비전 트랜스포머로 슬라이스별로 인코딩하며, 주변 슬라이스 특징을 풀링하여 국소적인 볼륨 토큰을 생성해요. 다른 피험자에서 유사한 토큰이 없는 경우 이상 점수가 높게 할당되며, 미세한 해상도 볼륨 점수를 위해 조잡-세밀 토큰화 전략을 도입하여 영상 모달리티에 따른 성능 변화를 확인했어요.