Pulse · AI 뉴스

ST-Merge: 모델 병합 제어 프레임워크로 다국어 추론 성능 향상

ST-Merge · 2026-06-17

연구진이 다국어 추론 성능을 높이는 ST-Merge 프레임워크를 제안했어요. 이 프레임워크는 모델 병합 시 입력에 따라 소스 모델 기여도를 조절하는 방식이에요.

ST-Merge는 gated cross-attention 메커니즘을 도입해 소스 모델의 기여도를 가중치 조절하거나 필터링해요.

4개의 다국어 추론 벤치마크에서 기존 모델보다 우수한 성능을 보였어요.

##모델병합##다국어##추론##ST-Merge##GatedCrossAttention

매일 핵심 AI 소식을 한국어로, 빠르게