Anthropic이 장편 비디오 생성 훈련 및 추론 워크플로우 속도와 메모리 병목 현상을 해결하는 NVFP4 기반 인프라 LongLive-2.0을 공개했어요.
LongLive-2.0은 기존 Self-Forcing 방식과 달리 디퓨전 모델을 직접 튜닝하여 장편, 멀티샷, 인터랙티브 AR 디퓨전 모델로 변환할 수 있어요.
Blackwell GPU에서 W4A4 NVFP4 추론을 지원하고, KV 캐시를 NVFP4로 양자화하여 메모리를 절약하고 엔드투엔드 처리량을 향상시켜요.
훈련 속도는 최대 2.15배, 추론 속도는 최대 1.84배 향상되었으며, LongLive-2.0-5B는 45.7 FPS의 추론 속도를 달성했어요.