연구진은 o1 모델에 안전 관련 사양을 직접 가르치고, 이를 추론하는 방법을 학습시키는 새로운 정렬 전략을 개발했어요. 이 전략은 모델이 안전 지침을 준수하는지 스스로 판단하고, 잠재적인 위험 상황을 식별하도록 돕는 것을 목표로 해요.