Stability AI가 새로운 텍스트-오디오 모델 'Stable Audio 3' 패밀리를 공개했어요. 이 모델은 음악과 음향 효과 생성을 위한 세 가지 모델을 Hugging Face에 공개했습니다.
Stable Audio 3 Medium 모델은 최대 6분 20초 길이의 음악과 음향 효과를 NVIDIA GPU에서 몇 초 만에 생성할 수 있어요. Small 모델은 CPU에서 효율적으로 실행될 수 있도록 최적화됐습니다.
Stability AI Community License로 배포되어 개인 및 창작 용도로 자유롭게 사용 가능하며, 모델 출력에 대한 로열티나 소유권을 주장하지 않아요.