R$^3$-SQL은 텍스트-SQL 시스템이 기능적으로 동일한 SQL 쿼리를 일관성 있게 평가하고, 정확한 SQL이 후보군에 없을 때를 회복할 수 있도록 설계했어요.
R$^3$-SQL은 실행 결과 기반 그룹화 및 순위를 통해 일관성을 확보하고, 그룹 내 선호도와 최상의 그룹 순위 및 크기를 결합하여 보상을 제공해요.
BIRD-dev 데이터셋에서 75.03%의 실행 정확도를 달성하며, 공개된 크기의 모델을 사용하는 방법 중 최고 성능을 기록했어요.