Pulse · AI 뉴스

OpenAI와 Anthropic, 공동 안전 평가 결과 공유

OpenAI · 2025-08-27

OpenAI와 Anthropic이 모델의 안전성을 평가하기 위해 공동 조사를 진행했어요.

이번 평가는 모델의 일탈, 지시 따르기, 환각 현상, 탈옥 시도 등을 테스트하는 방식으로 진행됐어요.

두 회사는 협력을 통해 안전성 평가의 중요성을 확인하고, 앞으로의 과제와 발전을 모색할 예정이에요.

##안전성평가##OpenAI##Anthropic

매일 핵심 AI 소식을 한국어로, 빠르게