Pulse · AI 뉴스

영화 ‘프로젝트 헤일 메리’ 로키 목소리 2일 만에 복제: 전체 파이프라인 공개 + 훈련 오디오 2분 10초 + RVC v2 모델 훈련

RVC · 2026-05-22

사용자가 영화 ‘프로젝트 헤일 메리’의 로키 영어 컴퓨터 목소리를 복제하는 데 성공했으며, 전체 파이프라인과 다운로드 파일을 공개했어요.

MKV 파일을 CLI 환경에서 작동하는 상태로 만드는 데 2일이 소요되었으며, ffmpeg, demucs, Whisper, pyannote 등 다양한 도구를 활용했어요.

RVC v2 모델을 300 에포크 동안 훈련했으며, 훈련된 모델은 짧은 발언에 적합하지만 긴 문장에서는 음성이 왜곡될 수 있어요.

##RVC##TTS##영화##프로젝트헤일메리##OpenSource
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기