AppTek이 콜센터 에이전트와 고객 간의 대화로 구성된 새로운 영어 음성 인식 데이터셋을 공개했어요. 데이터셋은 14가지 영어 억양과 16가지 서비스 시나리오를 포함하며, 기존 데이터셋의 한계를 극복하기 위해 제작되었어요. 다양한 음성 인식 시스템을 벤치마크한 결과, 일반적인 미국 영어 벤치마크 성능이 다른 억양으로 잘 일반화되지 않는다는 점을 확인했어요.