ArabiGEE는 아랍어 문법 오류 설명(GEE)을 위한 최초의 체계적인 분류 체계입니다. 기존 GEE 방식이 자유 형식 텍스트를 활용하는 것과 달리, ArabiGEE는 철자, 형태, 구문, 어휘 차원을 포괄하는 계층 구조를 통해 문법 설명을 구성합니다. 연구팀은 코드와 데이터를 공개했습니다.
이 체계는 27가지 오류 유형, 140가지 수정 유형, 324가지 설명을 포함합니다. ArabiGEE를 활용하여 기존 아랍어 문법 오류 수정 데이터셋을 수동으로 주석 처리하고 LLM의 아랍어 GEE 자동 평가를 지원할 수 있음을 입증했습니다.
ArabiGEE는 기존 GEE 방식의 한계를 극복하고, LLM의 아랍어 문법 오류 설명 능력을 평가하는 데 기여할 것으로 기대됩니다.