Pulse · AI 뉴스

AST: 훈련 없이도 자연스러운 음성 편집을 가능하게 하는 새로운 기술

arXiv cs.AI · 2026-04-17

연구진은 기존 음성 편집 방법의 한계점을 극복하기 위해 Adaptive, Seamless, and Training-free 음성 편집 프레임워크인 AST를 제안했어요.

AST는 사전 훈련된 TTS 모델을 활용하여 자연스러운 음성 편집과 스타일 편집을 가능하게 하며, Adaptive Weak Fact Guidance를 통해 편집 지점의 부작용을 최소화해요.

새로운 벤치마크 LibriSpeech-Edit와 Word-level Dynamic Time Warping(WDTW)을 공개하여 AST의 성능을 입증했으며, 기존 방식 대비 뛰어난 성능을 보여줬어요.

##음성편집##TTS##AI
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기