Pulse · AI 뉴스

규칙 기반 보상을 활용한 모델 안전 행동 개선

OpenAI · 2024-07-24

연구진은 모델의 안전한 행동을 유도하는 새로운 방법인 규칙 기반 보상(RBR)을 개발하고 적용했어요.

RBR은 광범위한 인간 데이터 수집 없이 모델을 안전하게 만들 수 있도록 설계되었어요.

이 방법은 모델이 안전하지 않은 행동을 하지 않도록 가이드라인을 제시하고, 이에 따라 보상을 제공하는 방식으로 작동해요.

##안전##보상##모델

매일 핵심 AI 소식을 한국어로, 빠르게