딥시크가 LLM 추론 속도와 서비스 효율을 높이는 최적화 기술인 ‘D스파크’를 오픈소스로 공개했어요. D스파크는 토큰을 먼저 생성하고 문맥에 맞게 보완하며, GPU 작업량에 따라 검증하는 토큰 수를 자동 조절해 추론 속도를 최대 85% 향상시킬 수 있어요. ‘딥시크-V4-프로-D스파크’와 ‘딥시크-V4-플래시’ 모델에 D스파크를 적용해 성능을 개선했어요.