사용자가 스펙커티브 디코딩 교육용 구현 저장소를 GitHub에 공개했어요. 이 저장소는 다양한 스펙커티브 디코딩 방법을 처음부터 구현하여 설계 차이점을 쉽게 연구할 수 있도록 돕습니다.
현재 EAGLE-3, Medusa-1, 초안 모델, PARD, N-gram 검색, 서픽스 디코딩 등 다양한 방법이 구현되어 있으며, Qwen/Qwen2.5-7B-Instruct 모델을 사용합니다.
이 저장소는 프로포저 품질과 검증 비용의 차이, 수용률과 처리량의 관계, 그리고 간단한 방법의 동작 방식 등 스펙커티브 디코딩의 알고리즘과 시스템 경계에서의 이해를 돕는 학습 자료로 제작되었습니다.