Qualcomm AI Research가 베트남어 텍스트 인코더 BamiBERT를 공개했어요. PhoBERT의 한계를 극복하고 2048 토큰까지 지원하며 외부 단어 분절 없이 원시 입력 처리 가능해요.
8개의 베트남어 벤치마크에서 15개 지표 중 11개에서 최고 점수를 기록하며 기존 모델을 능가하는 성능을 보여줬어요.
BamiBERT는 Hugging Face에서 공개되어 연구 및 활용 가능하며, 베트남어 자연어 처리 분야 발전에 기여할 것으로 기대돼요.