DeepSeek가 V4 모델의 기술적 깊이를 더한 논문 전문을 공개했습니다. FP4 양자화 인식 훈련(QAT)을 늦은 단계 훈련에서 직접 적용하여 모델 효율성을 높였습니다. V4-Pro는 1M 컨텍스트에서 기존 모델 대비 FLOPs, KV 캐시를 각각 27%, 10% 수준으로 줄였습니다. V4-Pro는 중국어 작문 평가에서 Gemini 3.1 Pro를 상대로 62.7% 승률을 기록했으며, 코딩 작업에서 사용자 만족도가 높습니다.