본 연구는 중세 오시탕, 중세 카탈루냐, 중세 프랑스어 품사 태깅에 LLM 기반 접근 방식이 기존 방식보다 우수함을 체계적으로 평가했습니다.
제로샷, 퓨샷 프롬프트, 단일 언어 미세 조정, 교차 언어 학습 등 다양한 환경에서 실험을 진행했으며, 미세 조정과 다국어 학습이 가장 큰 성능 향상을 가져왔습니다.
연구 결과는 디지털 인문학 연구에서 LLM 기반 품사 태깅 파이프라인을 구축하는 데 실질적인 지침을 제공하며, 관련 코드와 데이터셋을 공개했습니다.