SpiralFovea는 이미지 내용에 따라 토큰화 방식을 조절하는 새로운 기술입니다. 기존 방식과 달리 이미지의 시각적 엔트로피에 따라 토큰의 위치, 크기, 개수를 조정합니다. CUB-200-2011 Genus 데이터셋에서 4개의 백본 모델을 대상으로 실험한 결과, 정확도는 1.7~2.1%p 향상되고 입력 토큰 수는 60% 감소했습니다. 전체적으로 자가 주의 FLOPs는 84% 감소하고 처리량은 18~29% 향상되는 효과를 보였습니다.