Pulse · AI 뉴스

DeepSeek V4 Flash, DGX Spark에서 최고 성능 발휘하다

DeepSeek · 2026-06-01

Reddit 사용자가 DeepSeek V4 Flash 모델을 DGX Spark에서 실행하는 방법을 공유하며, 최대 100만 토큰의 컨텍스트를 안전하게 처리할 수 있다고 밝혔습니다.

DeepSeek V4 Flash는 코딩 작업 추론 성능이 M2.7 및 Stepfun 3.7보다 뛰어나며, 128K 컨텍스트에서 토큰당 40~42개의 토큰을 처리할 수 있습니다.

DeepSeek V4 Flash는 MOE 모델에서 뛰어난 성능을 보이며, 전력 소비량이 낮아(280W) 장시간 안정적으로 실행 가능합니다. Docker Compose 설정 파일도 공개되었습니다.

##DeepSeek##V4Flash##DGXSpark##vLLM##MOE

매일 핵심 AI 소식을 한국어로, 빠르게