Pulse · AI 뉴스

학술 논문 키워드 추출을 위한 다중 모드 데이터셋 구축

arXiv cs.CL · 2026-06-30

연구팀이 텍스트, 이미지, 오디오를 포함하는 1000개 샘플의 다중 모드 학술 논문 데이터셋을 구축했어요. 키워드 추출 성능 향상을 위해 텍스트, 이미지, 오디오 데이터를 활용한 실험을 진행했어요. 다양한 모드 정보의 차이점과 융합 효과를 분석한 결과, 모드 간 텍스트는 뚜렷한 특징을 보였어요.

논문 텍스트, 이미지 텍스트, 오디오 텍스트를 결합하면 학술 논문 키워드 추출 성능을 효과적으로 향상시킬 수 있다는 점이 확인되었어요.

##데이터셋##키워드추출##다중모드
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기