Pulse · AI 뉴스

빠른 시점, 신중한 주체: 확산 증강을 활용한 이중 프로세스 다자간 회전 제어

VoxConverse · 2026-06-15

연구진이 VoxConverse 데이터셋을 기반으로 다자간 회전 제어 문제를 연구했어요. 회전 경계 시점을 판단하는 시점과 실제 회전이 전달되는지 판단하는 단계를 분리하는 2단계 오디오 파이프라인을 제안했어요. 확산 기반의 데이터 증강 기법을 통해 시프트 감지 성능을 개선했어요.

빠른 트리거는 오디오를 스캔하여 회전 종료 후보 시간을 제안하고, 경량 검증기는 해당 시점에만 실행되어 extsc{Hold} 또는 extsc{Shift}를 결정하고 다음 화자 예측을 지원해요. 기존 방식 대비 성능 향상을 확인했어요.

연구진은 다자간 환경에서의 결과를 보고하고, 비교를 위해 제어된 2위 화자 투영을 사용했어요. 다자간 회전 제어는 음성 대화 시스템에 필수적이지만, 기존 방식은 2화자 상호작용에 맞춰져 있어 다자간 환경에서 어려움을 겪어요.

##음성대화##회전제어##확산모델##VoxConverse##다자간
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기