연구진은 LLM-as-a-Judge 환경에서 추론 기능이 정확도를 높이지만 비용 증가를 야기한다는 사실을 밝혀냈습니다. 복잡한 검증 작업에는 추론이 효과적이지만, 단순 평가에는 오히려 성능 저하나 비용 증가를 초래할 수 있습니다. RACER라는 새로운 라우팅 방법론을 제안하여, 예산 내에서 추론 및 비추론 판사를 상황에 맞게 선택하고 정확도와 비용 효율성을 극대화합니다.