Pulse · AI 뉴스

심층적 정렬: 추론이 더 안전한 언어 모델을 가능하게 합니다

OpenAI · 2024-12-20

연구진은 o1 모델에 안전 관련 사양을 직접 가르치고, 이를 추론하는 방법을 학습시키는 새로운 정렬 전략을 개발했어요.

이 전략은 모델이 안전 지침을 준수하는지 스스로 판단하고, 잠재적인 위험 상황을 식별하도록 돕는 것을 목표로 해요.

##모델정렬##안전성##추론

매일 핵심 AI 소식을 한국어로, 빠르게