Mixture of Experts(MoE)는 여러 전문가 서브모델과 어떤 전문가를 사용할지 결정하는 게이트 네트워크로 구성된 기술입니다. DeepSeek V4는 MoE 아키텍처 덕분에 1.6조 파라미터임에도 GPT-5.5의 10분의 1 가격으로 서비스될 수 있습니다. MoE는 모델의 크기를 키우면서도 계산 비용을 절감할 수 있게 해주는 효과적인 방법입니다.