본 연구는 인도네시아 Tokopedia 제품 리뷰 데이터셋에서 감성 분석을 위해 전통적인 머신러닝 기법과 IndoBERT 모델을 벤치마킹했습니다.
로지스틱 회귀, 선형 SVM, 나이브 베이즈를 TF-IDF 특징 추출과 함께 사용했으며, IndoBERT 모델은 파인튜닝하여 긍정, 중립, 부정 세 가지 감성으로 분류했습니다.
놀랍게도, 실험 결과 선형 SVM 모델이 97.60%의 정확도를 기록하며 IndoBERT 모델(88.70%)보다 우수한 성능을 보였으며, 이는 데이터 샘플링 방식의 차이 때문으로 분석되었습니다.