Anthropic이 Ettin ModernBERT 기반의 새로운 Sentence Transformers CrossEncoder reranker 6종을 공개했어요. 이 모델들은 기존 모델 대비 성능이 향상된 최첨단 재순위 모델입니다.
새로운 reranker들은 포인트 MSE를 활용한 증류 학습 방식으로 훈련되었으며, 다양한 임베더 조합과 함께 MTEB(eng, v2) Retrieval 성능을 보여줍니다.
사용자는 간단한 코드를 통해 reranker를 활용할 수 있으며, 긴 문서 재순위에도 적합한 최대 8K 토큰의 컨텍스트를 지원합니다.