연구진이 대형 커널 심층 컨볼루션의 메모리 접근성 문제를 해결하기 위해 윈도우드 배치 행렬 곱셈(WBMM)을 제안했어요.
WBMM은 입력 데이터를 윈도우로 나누고 배치 행렬 곱셈을 통해 정규 메모리 접근을 가능하게 하여, 윈도우 크기가 커질수록 처리 속도가 향상되는 특징을 가졌어요.
ImageNet-1K, COCO, ADE20K 데이터셋에서 1.31~1.88배 빠른 학습 속도를 보였으며, GPU, CPU, 엣지 디바이스에서 일관된 성능 향상을 보여줬어요.