연구에 따르면 손글씨 텍스트 인식(HTR) 시스템은 아랍 문자 데이터셋에서 라틴 문자 데이터보다 성능이 떨어지는 것으로 나타났어요.
본 연구에서는 CRNN 모델을 활용하여 9개 데이터셋(KHATT, Muharaf, NUST-UHWR, PHTD, IAM, READ-2016 등)과 다양한 학습 데이터 크기를 비교하며 아랍 문자 및 라틴 문자 HTR의 성능 격차 원인을 분석했어요.
분석 결과, 데이터 규모가 커져도 5~7%의 CER 포인트 격차가 지속되며, 아랍 문자는 시각적 변동성이 높아 더 많은 데이터가 필요하다는 점을 확인했어요.