Pulse · AI 뉴스

방글라 Key2Text: 키워드 기반 텍스트 생성 데이터셋 공개

Bangla Key2Text · 2026-04-21

연구진이 방글라어를 위한 키워드-텍스트 쌍 데이터셋 'Bangla Key2Text'를 구축했어요. 이 데이터셋은 260만 개의 키워드와 텍스트 페어 쌍으로 구성되어 있으며, 뉴스 기사를 활용해 만들었어요.

BERT 기반 파이프라인을 통해 키워드를 추출하고 텍스트와 연결하여 데이터셋을 구축했어요.

mT5와 BanglaT5 모델을 활용한 실험 결과, 키워드 기반 텍스트 생성 성능이 향상되었으며, 관련 자료를 공개하여 연구를 지원할 예정이에요.

##데이터셋##방글라어##텍스트생성
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기