Pulse · AI 뉴스

베트남어 추론 격차 해소를 위한 소규모 언어 모델 연구: 테스트 시간 스케일링 활용

Qwen · 2026-04-20

연구진은 자원 제약적인 환경에서 소규모 언어 모델(SLM)의 추론 능력을 향상시키는 데 초점을 맞춰, 특히 베트남어와 같은 비영어권 언어에서 발생하는 추론 격차 문제를 해결하고자 했습니다.

Vi-S1K 데이터셋과 Vi-Elementary-Bench 벤치마크를 활용하여 Qwen3-1.7B 모델의 성능을 평가한 결과, 지도 학습(SFT)을 통해 모델의 추론 능력이 크게 향상되었으며, 설명 품질이 77% 개선되었습니다.

연구 결과, 복잡한 에이전트 워크플로우보다 단순화된 테스트 시간 스케일링과 지도 학습을 결합하는 것이 SLM의 엣지 기반 추론에 더 효과적인 것으로 나타났습니다.

##언어모델##베트남어##추론

매일 핵심 AI 소식을 한국어로, 빠르게