Pulse · AI 뉴스

LVSA: 트레이닝 불필요한 희소 어텐션으로 긴 영상 디퓨전 성능 향상

HunyuanVideo · 2026-05-29

LVSA(Long Video Sparse Attention)는 긴 영상 디퓨전 트랜스포머의 연산 부담을 줄이는 모델-독립적인 블록 희소 어텐션 기술이에요.

구조화된 윈도우 패턴과 회전하는 글로벌 앵커를 결합하여 장거리 시간적 아티팩트를 유발하는 고정 그리드 편향을 제거해요.

LVSA는 Wan 2.1 1.3B에서 최대 3.17배, Wan 2.1 14B에서 2.98배, HunyuanVideo 1.5에서 3.33배 연산량을 줄여줘요.

##LVSA##어텐션##영상디퓨전##HunyuanVideo

매일 핵심 AI 소식을 한국어로, 빠르게