연구진이 제2언어 습득 연구를 위해 18억 파라미터 규모의 Dango 모델을 공개했어요. 기존 연구는 작은 모델에 의존했지만, Dango는 자유로운 텍스트 생성과 L2 시뮬레이션에 적합하도록 설계됐어요.
L1 학습 코퍼스에 영어 노출을 최소화하는 필터링 방법을 제안하고, LLM이 생성한 L2 학습 레슨으로 모델을 파인튜닝했어요.
평가 결과, Dango는 인간과 유사한 L2 생성 패턴을 보이며, 필터링되지 않은 다국어 모델보다 뛰어난 성능을 보여줬어요.