Pulse · AI 뉴스

Transformer 모델 효율화를 위한 보완적 어텐션 헤드 가지치기

arXiv cs.LG · 2026-06-17

연구진은 Transformer 모델의 효율적인 가지치기 방법인 CAHP(Complementary Attention Head Pruning)를 제안했어요.

CAHP는 어텐션 헤드를 개별적으로 평가하는 대신, 그래프 기반 클러스터링과 정보 이론 기반 거리 측정으로 상호 보완적인 헤드를 식별하고 보존해요.

SST-5와 MNLI 벤치마크에서 CAHP는 기존 방법보다 뛰어난 성능을 보였으며, 특히 고압축 환경에서 효과적이에요.

##Transformer##가지치기##CAHP##어텐션

매일 핵심 AI 소식을 한국어로, 빠르게