DeepSeek AI가 모델 추론 성능을 높이는 'DeepSpec' 코드베이스를 공개했어요. 데이터 준비 도구, 모델 구현, 학습 코드, 평가 스크립트 등을 포함하고 있어요.
공개된 체크포인트는 논문의 Table 1에 사용된 것으로, 특정 모델의 비-싱킹 모드에서 생성된 open-perfectblend 데이터로 학습됐어요.
DeepSpec은 현재 DSpark, DFlash, Eagle3 세 가지 모델을 지원하며, GitHub와 Hugging Face에서 관련 정보 확인 가능해요.