본 연구는 LLM 앙상블을 혼합 모델로 재해석하여 효율성을 높이는 ME(Mixture-model-like Ensemble) 기법을 제안합니다. ME는 각 단계에서 단일 모델을 무작위로 선택하여 토큰을 생성하여 앙상블 분포를 명시적으로 계산할 필요성을 없애 1.78배에서 2.68배 빠른 속도를 제공합니다. 연구 결과는 효율적인 LLM 앙상블을 위한 새로운 가능성을 열고 토큰 수준 라우팅 전략 탐색을 촉진합니다.