Anthropic이 LLM을 활용한 산업 규모 추천 시스템 재순위 모델 GR2를 공개했어요. GR2는 산업 규모 트래픽에서 기존 모델 대비 R@1 18.7%, R@3 7.1%, N@3 9.6% 성능 향상을 달성했어요. 모델은 토크나이저로 생성된 고유한 ID로 중간 학습하고, 더 강력한 모델의 추론 과정을 활용하며, 강화 학습을 통해 보증 가능한 보상을 사용해요.