연구진이 다양한 사용자 의도를 반영하여 실시간으로 네트워크 계획을 최적화하는 OmniPlan 프레임워크를 제안했어요.
OmniPlan은 LLM 기반 인터프리터를 활용해 자연어 의도를 통일된 벡터로 변환하고, MIP 솔버, 휴리스틱, DRL 모델을 통합한 Mixture-of-Experts 구조를 사용해요.
실험 결과, OmniPlan은 분산 머신러닝 추론 작업에서 지연 시간을 최대 97.8% 줄이고 네트워크 자원 소비를 최대 11.5% 감소시키는 성능을 보였어요.