연구진이 인간 피드백을 활용하여 1만 배에 달하는 학습 데이터 감소에도 불구하고 고품질 라벨을 얻는 방법을 개발했어요. 새로운 방법은 기존 방식보다 훨씬 적은 데이터로도 모델 성능을 유지하거나 향상시킬 수 있다는 것을 보여줘요.