이 논문은 Qwen3, Gemma-3, Llama-3, Aya 등 다양한 모델을 대상으로 토큰 가지치기 기법을 적용하여 한국어 중심 자연어 처리(NLP) 성능을 평가했어요. 토큰 가지치기는 언어 혼동을 줄여 생성 안정성을 높이고, 기계 번역의 경우 한국어 관련 작업 성능을 향상시키는 것으로 나타났어요. 어휘 크기 감소는 메모리 제약이 있는 특정 분야 배포에 효과적인 최적화 전략이지만, 추론 지연 시간에도 소폭의 증가가 있을 수 있어요.