연구진이 Edge/Fog 환경에서 LLM 배포 효율성을 높이는 E2LLM 프레임워크를 개발했어요. E2LLM은 모델을 여러 그룹으로 복제하고, 각 그룹에 PREFILL 또는 DECODER 역할을 부여하여 효율성을 높여요. Genetic Algorithm과 Dynamic Programming을 활용하여 클러스터링 및 파티셔닝 전략을 최적화하여 대기 시간을 50% 이상 단축했어요.