연구진이 중국어 IEP 자동 생성 파이프라인을 제안했어요. 코퍼스 기반 특징 확산(CGFD) 기법을 활용해 저자원 환경에서도 효과적인 IEP 생성 가능성을 확인했어요. Grammar-Constrained Decoding(GCD)를 적용했으나, 중국어 환경에서는 오히려 성능 저하를 일으켰어요. Breeze-7B 모델을 QLoRA로 파인튜닝하여 GPT-5.4, DeepSeek-V3.2 등 해외 모델을 능가하는 성능을 보여줬어요.
중국어 특수교육 NLP 분야의 공백을 메우고, 개인 정보 보호를 강화한 로컬 추론 솔루션을 제공해요. 학부모-교사 면담 내용을 바탕으로 IEP를 자동 생성하는 시스템을 구축했어요.
연구진은 25개의 시드 트랜스크립트를 선정하고, 특징 프로필을 추출하여 LLM 프롬프트에 주입하는 방식으로 확산을 유도했어요. 15개의 전문가 골드 시드를 사용하여 585개의 샘플을 타겟팅했어요.
연구 결과, GCD를 사용하지 않는 경로가 더 빠른 속도와 높은 신뢰성을 보여줬으며, 스키마 준수율도 100%를 달성했어요.