audio.cpp 개발자가 VibeVoice 1.5B 모델 지원을 추가하고 벤치마크 결과를 공유했어요. RTX 5090에서 90분짜리 팟캐스트를 22.95분에 생성하며, 실시간보다 4.08배 빠르고 Python으로는 2.86배 빠른 속도를 보여요. audio.cpp는 재사용 가능한 세션, 서버 같은 사용, 장시간 생성, 안정적인 메모리 관리, CUDA 최적화에 집중한 로컬 오디오 모델 런타임이에요.