연구진이 막대한 계산 비용, 언어 편중, 투명성 부족 문제를 해결하기 위해 다국어 지원 텍스트 임베딩 모델 ML-Embed를 공개했어요.
3-Dimensional Matryoshka Learning (3D-ML) 프레임워크를 기반으로 모델 생명 주기 전반에 걸쳐 효율성을 높였고, 140M에서 8B 파라미터 규모의 모델을 개발했어요.
9개의 MTEB 벤치마크에서 최고 기록을 달성했으며, 특히 저자원 언어에서 뛰어난 성능을 보이며, 전 세계적으로 공정하고 효율적인 AI 시스템 구축을 위한 청사진을 제시했어요.