연구진은 LLM 기반 코드 생성의 성능 한계를 극복하기 위해 새로운 커리큘럼 강화 학습 프레임워크인 RECRL을 제안했습니다. RECRL은 모델별 요구사항 난이도를 자동으로 인식하고, 어려운 요구사항을 최적화하며, 적응형 커리큘럼 샘플링 전략을 사용합니다. 5가지 최첨단 LLM과 5가지 널리 사용되는 코드 생성 벤치마크에서 RECRL은 기존 방식 대비 Pass@1 성능을 평균 1.23%~5.62% 향상시켰습니다.