Pulse · AI 뉴스

인도네시아 인스타그램 댓글의 사이버 괴롭힘 탐지를 위한 AutoML과 BiLSTM 모델 비교 분석

arXiv cs.CL · 2026-04-29

이 연구는 인도네시아어 인스타그램 댓글에서 사이버 괴롭힘 탐지를 위해 머신러닝과 딥러닝 접근 방식을 비교했어요. 650개의 댓글로 구성된 균형 잡힌 데이터셋을 사용하여 Naive Bayes, Logistic Regression, Support Vector Machine과 BiLSTM, Bahdanau Attention 모델을 평가했어요.

머신러닝 모델 중 Logistic Regression이 가장 좋은 성능을 보였고, Attention을 적용한 BiLSTM이 딥러닝 분야에서 가장 강력한 성능을 달성했어요. 인도네시아어 텍스트에 특화된 전처리 과정의 중요성을 강조하고, 딥러닝이 문맥 패턴을 더 잘 파악하지만 자원이 부족한 환경에서는 머신러닝이 경쟁력 있는 선택지가 될 수 있음을 보여줘요.

이 연구는 비공식 인도네시아어 텍스트에 적합한 전처리 파이프라인을 적용하여 슬랭 정규화, 불용어 제거, 어간 추출을 수행했어요.

##머신러닝##딥러닝##사이버괴롭힘##인도네시아어##자연어처리
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기