VLLM 프로젝트가 코히어(Cohere)에서 개발한 새로운 Mixture of Experts(MoE) 모델을 지원할 예정입니다. MoE 모델은 여러 개의 작은 모델을 결합하여 성능과 효율성을 높이는 기술로, VLLM을 통해 더욱 빠르게 추론할 수 있습니다. 이번 지원을 통해 VLLM 사용자들은 코히어의 최신 모델을 활용하여 다양한 자연어 처리 작업을 수행할 수 있을 것으로 기대됩니다.