연구진은 액션 확산 모델의 속도 저하 문제를 해결하기 위해 Test-time Sparsity 기법을 제안했습니다. 이 기법은 모델 추론 시 불필요한 연산을 동적으로 예측하여 제거합니다. 연구 결과, FLOPs를 92% 줄이고 액션 생성 속도를 5배 향상시켰으며, 프레임당 47.5Hz의 추론 속도를 달성했습니다.
기존 Test-time Sparsity 기법의 한계를 극복하기 위해, 연구진은 고도로 병렬화된 추론 파이프라인을 설계하고, 이전 denoising 단계에서 캐시된 특징을 활용하는 omnidirectional reusing 전략을 도입했습니다. 이를 통해 95%의 높은 sparsity를 달성했습니다.
연구진은 액션 경로를 샘플링하여 sparsified diffusion 단계를 단계별로 지도 학습했으며, GitHub 저장소를 통해 관련 코드를 공개했습니다.