Pulse · AI 뉴스

구글 임베딩 2, 다국어 검색 및 RAG 시스템에서 오픈소스 모델과 성능 비교

Google · 2026-05-22

구글 임베딩 2(GE2)가 BGE-M3, E5-large 등 5개의 오픈소스 모델과 다국어 검색 성능을 비교했어요. BEIR 평가에서 GE2가 가장 높은 성능을 보였지만, 응답 속도는 최대 14배 느렸어요. 31ms 응답 속도를 보이는 mE5-L 모델은 GE2와 거의 비슷한 성능을 보이면서도 빠른 속도를 제공해, 100ms 이내의 응답 속도가 중요할 때 좋은 선택이 될 수 있어요.

LaBSE 모델은 널리 사용되고 있지만, BEIR 평가에서는 다른 모델들보다 낮은 성능을 기록했어요. 32토큰 크기의 청킹에서 모델들은 성능이 포화되는 경향을 보였으며, 16토큰 크기의 의미론적 청킹이 성능 향상에 도움이 되는 것으로 나타났어요.

##임베딩##검색##RAG##구글##다국어

매일 핵심 AI 소식을 한국어로, 빠르게

App Store 에서 Pulse 받기 앱에서 열기