FMplex는 기반 모델(FM) 서빙 시스템으로, 개별 작업마다 독립적인 모델 인스턴스를 배포하는 대신 FM 백본을 공유하여 자원 낭비를 줄입니다. FMplex는 각 작업에 가상 기반 모델(vFM)을 제공하여 백본을 공유하면서도 작업별 확장을 유지합니다. 배치 인식 공정 큐잉 스케줄러를 통해 작업 간/내 배치 처리를 최적화하여 지연 시간을 최대 80% 단축했습니다.