Pulse · AI 뉴스

FlowEdit: 흐름 매칭 TTS의 평생 발음 적응을 위한 연상 기억

FlowEdit · 2026-06-19

FlowEdit은 frozen된 흐름 매칭 TTS의 지속적인 발음 적응을 위한 프레임워크입니다. 새로운 발음 교정 피드백을 받으면 텍스트 임베딩 공간에서 토큰 수준의 교정 변경을 최적화합니다. 현대 호프필드 네트워크에 교정을 저장하여 콘텐츠 주소 지정 에피소드 메모리를 활용합니다.

312개 다국어 고유 명사 벤치마크에서 목표 단어 음소 오류율을 기준선 대비 92.7% 줄였습니다. 일반적인 음성 품질은 그대로 유지합니다.

교정은 단일 GPU에서 약 15초 만에 완료됩니다.

##TTS##FlowMatching##발음교정##연상기억##FlowEdit
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기