OpenAI와 Anthropic이 모델의 안전성을 평가하기 위해 공동 조사를 진행했어요. 이번 평가는 모델의 일탈, 지시 따르기, 환각 현상, 탈옥 시도 등을 테스트하는 방식으로 진행됐어요. 두 회사는 협력을 통해 안전성 평가의 중요성을 확인하고, 앞으로의 과제와 발전을 모색할 예정이에요.