mudler가 Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled 모델의 APEX-MTP GGUF 양자화 버전을 공개했어요. 이 버전은 자체 예측 디코딩을 위한 MTP 헤드를 번들로 제공합니다.
MTP 헤드를 번들로 제공하여 별도의 초안 모델 없이도 자체 예측 디코딩을 사용할 수 있으며, 파일 크기는 일반 버전보다 약 2.5% 더 큽니다.
APEX 양자화는 MoE(Mixture of Experts)에 적합하며, 다양한 데이터셋으로 교정되어 모델 정확도를 높였습니다. 연구 개발 비용을 지원하려면 사용자의 후원을 부탁드려요.