방글라어와 같이 자원이 부족한 언어에서 가짜 뉴스 탐지 시스템 개발은 데이터 부족 문제에 직면해 있습니다. 연구진은 Gemma 3 27B IT 모델을 활용하여 가짜 뉴스 분류 성능을 향상시키는 데이터 증강 프레임워크를 제안했습니다. 실험 결과, 소수 클래스를 높은 증강 비율로 증강하고 무작위 서브샘플링을 사용했을 때 Fake News F1 점수가 0.85에서 0.88로 향상되었습니다.