Google이 텍스트, 이미지, 오디오, 비디오를 통합적으로 표현하는 Gemini 임베딩 2를 공개했어요. Gemini의 멀티모달 기능을 활용해 다양한 조합의 입력에 대한 임베딩을 생성하며, 다양한 작업에서 뛰어난 성능을 보입니다. MSCOCO에서 62.9 R@1, Vatex에서 68.8 NDCG@10 등 주요 임베딩 벤치마크에서 최고 성능을 달성했어요.