연구진이 다양한 평가 기준을 통합하는 Skill-RM 프레임워크를 제안했어요. Skill-RM은 보상 모델링을 재사용 가능한 보상 평가 스킬 실행으로 재구성하여 다양한 리소스를 일관되게 조율하고 증거를 동적으로 선택하고 집계해요. 기존 방식보다 일관성과 투명성을 확보하며, 다양한 작업에서 기존 평가 기준보다 우수한 성능을 보여줬어요. Skill-RM의 코드는 GitHub에서 확인할 수 있어요.