연구진이 다국어 추론 성능을 높이는 ST-Merge 프레임워크를 제안했어요. 이 프레임워크는 모델 병합 시 입력에 따라 소스 모델 기여도를 조절하는 방식이에요. ST-Merge는 gated cross-attention 메커니즘을 도입해 소스 모델의 기여도를 가중치 조절하거나 필터링해요. 4개의 다국어 추론 벤치마크에서 기존 모델보다 우수한 성능을 보였어요.