콜센터에서 대기 시간 낭비를 줄이기 위해 실시간 통화에서 인간의 존재를 감지하는 도구를 개발하자는 제안입니다.
도구는 IVR 탐색 후 통화 오디오 스트림을 분석하여 통화가 대기열에서 벗어나 실시간 상담원에게 연결되었는지 판단합니다.
RVA(녹음된 음성 안내)와 인간의 음성 구분을 포함한 다양한 어려움이 예상되며, 머신 러닝을 통해 음향, 파형 또는 스펙트로그램을 분석하는 접근 방식이 제안되었습니다.
기존 프레임워크(YamNet, Whisper 등) 활용 및 데이터 라벨링 방법, 기존 데이터셋 활용에 대한 지원을 요청하고 있습니다.