연구진은 대형 언어 모델의 높은 비용과 개인 정보 보호 문제를 해결하기 위해 소형 언어 모델(SLM)을 활용한 텍스트-SQL 생성 프레임워크인 FINER-SQL을 제안했습니다.
FINER-SQL은 실행 피드백을 통해 SLM의 추론 능력과 지시 따르기 능력을 향상시키며, 메모리 보상과 원자 보상을 통해 이산적인 정확성 신호를 연속적인 학습 신호로 변환합니다.
BIRD 및 Spider 벤치마크에서 FINER-SQL은 3B 모델로 최대 85%의 실행 정확도를 달성하여 훨씬 더 큰 LLM과 동등한 성능을 보이면서 추론 지연 시간을 5.57초/샘플로 줄였습니다.