Pulse · AI 뉴스

다국어 모델을 활용한 지속적 학습 연구

XLM-RoBERTa · 2026-05-13

본 연구는 다국어 소셜 미디어에서 혐오 표현의 재사용을 탐지하는 다단계 프레임워크를 제시하며, 영어, 스페인어, 이탈리아어 트윗을 분석합니다.

데이터 부족, 불균형, 언어 간 감정 표현 차이 등 세 가지 주요 과제를 해결하기 위해 백역번역, 인덕티브 전이 학습, 마스크 언어 모델링 등 다양한 기술을 통합했습니다.

평가 결과, XLM-RoBERTa 모델이 가장 우수한 성능을 보였으며, 언어별 의사 결정 임계값 조정으로 F1 점수가 2~5% 향상되었습니다.

##연구##다국어##NLP

매일 핵심 AI 소식을 한국어로, 빠르게