본 논문은 교육 벤치마크(EduBench)를 위한 응답 생성 시스템인 Pangu-ACE를 소개하며, 1B 파라미터의 튜터-라우터와 7B 파라미터의 전문가를 활용한 카스케이드 구조를 채택합니다.
Pangu-ACE는 19.7%의 요청을 1B 모델로 직접 처리하며, CPU 측면 재평가 결과, 기존 시스템보다 응답 품질과 형식 유효성을 향상시켰습니다.
현재 배포된 시스템은 지연 시간 개선을 보여주지 않지만, 라우팅 선택성을 통해 효율성을 확보했으며, GPT-4를 활용한 재평가 기반선 정렬은 인프라 복구 후 진행될 예정입니다.