Pulse · AI 뉴스

Qwen3.6-35B에 AMG 적용 실험: 후처리 게이팅의 한계와 향후 과제

Qwen · 2026-06-30

cjhudlin 사용자가 Qwen3.6-35B 모델에 Adaptive Mixture of Experts Gate (AMG)를 후처리 방식으로 적용하는 실험 결과를 공유했어요. AMG는 토큰당 가변적인 전문가 수를 선택하는 방식입니다.

실험 결과, 후처리 AMG 게이팅은 품질 저하 없이 토큰별 가변성을 확보하기 어려웠으며, 오히려 성능 저하를 초래했어요. 전문가의 분포가 균일하게 만들어져 있어, 임계값을 적용해도 의미 있는 변화를 얻기 어려웠습니다.

향후 연구 방향으로, 게이트 파라미터만 fine-tuning하고 전문가 FFN 가중치는 고정하는 방안을 제시했습니다. 엔트로피 정규화와 균등 분포 KL divergence를 활용하여 토큰별 가변성을 확보하는 것이 목표입니다.

##MoE##Qwen##AMG##최적화##연구
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기