연구진은 모델의 안전한 행동을 유도하는 새로운 방법인 규칙 기반 보상(RBR)을 개발하고 적용했어요. RBR은 광범위한 인간 데이터 수집 없이 모델을 안전하게 만들 수 있도록 설계되었어요. 이 방법은 모델이 안전하지 않은 행동을 하지 않도록 가이드라인을 제시하고, 이에 따라 보상을 제공하는 방식으로 작동해요.