연구진이 대규모 이미지 생성 모델의 파라미터 수를 줄이는 TMP(Tree-structured Mixed-policy Pruning) 프레임워크를 제안했어요. HunyuanImage-3.0 모델을 80B에서 20B로 압축하며 75% 파라미터 감소를 달성했어요.
TMP는 Mixtral of Experts(MoE)와 Diffusion Transformer(DiT) 아키텍처에 적용 가능하며, 이미지 생성 및 편집 작업에 활용돼요.
연구진은 TMP를 통해 HunyuanImage-3.0의 20B 버전을 단일 24GB 4090 GPU에서 실행할 수 있도록 최적화하고, 관련 스크립트와 모델 가중치를 공개했어요.