연구진은 다중 모드 대규모 언어 모델(MLLM)의 잠재력을 활용하여 범용 다중 모드 임베딩을 제안했어요. RIME 프레임워크는 생성과 임베딩을 공동으로 최적화하여 검색에 적합한 재작업을 수행하고, 효율성과 정확성 간의 균형을 맞추는 CMA 기술을 도입했어요. MMEB-V2, MRMR, UVRB 데이터셋에서 RIME은 기존 생성 임베딩 모델보다 성능이 뛰어나고, 생각 단계를 줄이는 데 효과적이었어요.