Pulse · AI 뉴스

자연어 음성 모델에서 MoE 아키텍처로: 강력한 반 스푸핑을 위한 전환

Mixture-of-Experts · 2026-06-13

자연어 음성 모델의 발전으로 스푸핑 탐지 어려움이 커지고 있어요. 기존 반 스푸핑 시스템은 새로운 합성 방식에 대한 강건성이 부족하다는 한계가 있습니다. 이번 연구에서는 자기 지도 학습 음성 표현 모델을 Mixture-of-Experts (MoE) 아키텍처로 전환하여 일반화 성능을 개선했어요.

선택된 인코더 레이어의 피드 포워드 블록을 전문가 네트워크로 대체하고 레이어별 게이팅 메커니즘을 적용하여 상호 보완적인 음향 패턴을 포착했어요. 자기 지도 학습 사전 훈련 과정에서 학습된 표현은 유지했습니다.

14개의 스푸핑 데이터셋 평가 결과, macro EER이 5.46%에서 4.81%로 감소하며 기준 모델 대비 11.9% 성능 향상했어요.

##음성인식##스푸핑##MoE##자기지도학습##반스푸핑
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기