연구팀이 희소 시퀀스 병렬 처리, HiF8 양자화, 강화 학습을 통합한 비디오 생성 모델 OSP-Next를 공개했어요.
OSP-Next는 Skiparse-2D Attention을 활용한 하이브리드 풀-스파스 어텐션 아키텍처를 사용하며, 단일 GPU에서 최대 1.64배, 8 GPU에서 1.52배 속도 향상을 달성했어요.
HiF8 양자화를 적용하여 8비트 양자화와 희소 파인튜닝을 안정적으로 진행했으며, VBench 총점 83.73%를 기록하며 Wan2.1을 능가했어요.
NVIDIA H200 GPU 및 Ascend 950PR에서 효율성과 성능을 입증하며, 다양한 하드웨어 플랫폼에서 활용 가능성을 보였어요.