Pulse · AI 뉴스

mudler/Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF 공개

Qwen · 2026-05-31

mudler가 Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled 모델의 APEX-MTP GGUF 양자화 버전을 공개했어요. 이 버전은 자체 예측 디코딩을 위한 MTP 헤드를 번들로 제공합니다.

MTP 헤드를 번들로 제공하여 별도의 초안 모델 없이도 자체 예측 디코딩을 사용할 수 있으며, 파일 크기는 일반 버전보다 약 2.5% 더 큽니다.

APEX 양자화는 MoE(Mixture of Experts)에 적합하며, 다양한 데이터셋으로 교정되어 모델 정확도를 높였습니다. 연구 개발 비용을 지원하려면 사용자의 후원을 부탁드려요.

##Qwen##APEX##GGUF##양자화##llama.cpp

매일 핵심 AI 소식을 한국어로, 빠르게