사용자 Great-Investigator30가 코코로 보이스 훈련을 위한 GUI 'Derpy Turtle'을 개발했습니다. 이 도구는 코코로 음성 검색과 RVC 음성 변환을 결합하여 더 나은 로컬 음성 출력을 생성합니다.
Derpy Turtle은 타겟 음성 클립을 로드하고, 코코로 음성을 검색/정제하며, RVC 모델을 훈련하고, 코코로 음성을 생성하고, RVC 모델을 통해 변환된 음성을 저장하는 기능을 제공합니다.
코코로 유사성 점수만 쫓는 것보다 코코로를 깨끗한 음성 소스로 사용하고 RVC가 최종 음성 정체성을 처리하는 것이 더 효과적이라는 점을 강조합니다.
CUDA를 사용하면 RTX 3060에서 GPU 모드가 CPU 모드보다 실행 시간을 26시간에서 4시간으로 단축할 수 있습니다.
개인/연구용으로 100% 무료이며, 상업적 사용을 원하는 경우 개발자와 연락해야 합니다.