연구팀이 비디오 확산 모델의 속도 저하 문제를 해결하기 위해 Veda 프레임워크를 개발했어요. Veda는 희소 어텐션 마스크와 전체 어텐션 타일 구조의 정렬을 최적화하여 성능 저하 없이 속도를 향상시킵니다. Waver와 Wan2.1 모델 실험 결과, 720P 10초 비디오 생성 시 최대 10.5배 빠른 속도를 보였어요.
Veda는 어텐션 비용을 줄이기 위해 통계 기반 타일 점수와 헤드 기반 타일링을 결합하여 어텐션 오차와 구조적 불일치를 최소화해요. 하드웨어 효율적인 타일 건너뛰기 커널을 통해 이론적 희소성을 실제 속도 향상으로 연결합니다.
Veda는 시공간 해상도 증가에 따라 더욱 효과적으로 확장 가능하며, 720P 10초 비디오 생성 시 전체 속도를 5.1배, 어텐션 속도를 10.5배 향상시켰어요.