연구진은 Transformer 모델의 효율적인 가지치기 방법인 CAHP(Complementary Attention Head Pruning)를 제안했어요. CAHP는 어텐션 헤드를 개별적으로 평가하는 대신, 그래프 기반 클러스터링과 정보 이론 기반 거리 측정으로 상호 보완적인 헤드를 식별하고 보존해요. SST-5와 MNLI 벤치마크에서 CAHP는 기존 방법보다 뛰어난 성능을 보였으며, 특히 고압축 환경에서 효과적이에요.