연구진은 LLM이 저자원 언어에서 차용어와 어휘 창신을 제대로 반영하는지 조사하기 위해 LexNeo-Bench라는 벤치마크를 개발했어요. 이 벤치마크는 룩셈부르크어 뉴스 코퍼스로부터 생성되었으며, 차용어 유형 분류 및 어휘 창신성 대리 과제를 평가해요.
지식 그래프를 활용한 프롬프트는 차용어 분류 정확도를 크게 향상시켰으며, 소형 모델과 대형 모델 간의 격차를 줄여줬어요. 하지만 어휘 창신성 감지는 여전히 어렵고 프롬프트 설계에 민감했어요.
이 연구는 어휘를 고려한 프롬프트가 저자원 접촉 언어에서 차용어 판단에 매우 유용하며, 어휘 자원이 LLM 평가를 위한 구조화된 맥락으로 활용될 수 있음을 보여줘요.