본 연구는 라틴어에서 로망스어로의 문법 성 변화 과정을 심층 학습 프레임워크를 통해 분석합니다. 기존 토큰화 방식의 한계를 극복하기 위해 새로운 토큰화 전략을 제안하고, 어휘 수준과 문맥 수준에서 성 예측에 영향을 미치는 요인을 평가했습니다. 연구 결과, 어휘 정보와 문맥 정보가 문법 성 예측에 기여하는 정도를 파악할 수 있었습니다.
코드, 데이터셋, 분석 결과는 공개적으로 이용 가능합니다.
본 연구는 저자원 환경에서 역사 언어학 연구에 활용될 수 있는 새로운 접근 방식을 제시합니다.