Pulse · AI 뉴스

다국어 모델 활용, 영어-프라크리트 기계 번역 성공

indictrans2 · 2026-06-04

연구진이 저자원 환경에서 영어-프라크리트 기계 번역을 연구했어요. 다국어 모델을 활용해 프라크리트어를 힌디어 태그로 매핑하는 방식을 사용했어요. Maharashtri 프라크리트 병렬 코퍼스 데이터셋을 활용해 성능을 개선하고 Ardhamagadhi 테스트 세트에서 BLEU 점수 향상을 확인했어요.

스크립트 호환 언어 라우팅을 통해 지원되지 않는 고전어에 대한 번역이 가능함을 보여줬지만, 데이터 부족과 방언 불일치로 인한 한계도 확인했어요. 연구 결과는 GitHub에서 공개됐어요.

이번 연구는 저자원 환경에서 고전어 기계 번역 가능성을 제시하며, 데이터 확보와 방언 표준화의 중요성을 강조합니다.

##기계번역##프라크리트##다국어모델##저자원
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기