vllm 프로젝트가 v0.21.0rc1 버전을 출시하며 DeepGEMM _C를 번들링하여 Python SO 임포트 문제를 해결했습니다. 이번 업데이트는 DeepGEMM _C를 직접 번들링하여 빌드 프로세스를 간소화하고, Python 환경과의 호환성을 높이는 데 중점을 두었습니다. vllm 팀은 지속적인 개선을 통해 더 빠르고 안정적인 LLM 추론 환경을 제공할 계획입니다.