Appen Inc.와 DataoceanAI가 다양한 억양을 포함하는 고품질 영어 ASR 데이터셋을 제공했습니다.
벤치마킹 위험을 방지하기 위해, 이 데이터셋은 현재는 비공개로 유지되며, 리더보드 평균 WER은 공개 데이터셋으로만 계산됩니다.
새로운 데이터셋을 선택적으로 포함하여 성능에 미치는 영향을 확인할 수 있으며, 표준화와 개방성을 통해 의미 있는 벤치마킹을 지원합니다.
데이터셋은 스크립트 및 대화형 음성을 포함하며, 호주, 캐나다, 인도, 미국 등 다양한 억양을 커버합니다.
오픈 ASR 리더보드는 2023년 9월 출시 이후 71만 회 이상 방문되었으며, 모델 성능을 지속적으로 개선하기 위해 노력하고 있습니다.