Pulse · AI 뉴스

Fable 5의 사이버 보안 안전 장치 및 탈옥 프레임워크 상세 공개

Anthropic · 2026-07-02

앤트로픽이 Fable 5 모델을 전 세계적으로 재배포했으며, 사이버 보안 안전 장치와 AI 탈옥 심각도 프레임워크에 대한 추가 정보를 공개했어요.

Fable 5의 안전 분류기는 사이버 보안 사용의 위험도를 4가지 범주로 구분하며, 위험도가 높은 활동은 차단하고, 방어적 이점이 있는 활동은 허용해요. 안전 마진을 설정하여 오탐을 줄이면서 유해한 행동을 방지하고 있어요.

앤트로픽은 AI 개발자와 정부 간의 일관된 의사소통을 돕기 위해 AI 탈옥 심각도 프레임워크 초안을 공개했으며, 학계, 산업계, 시민 사회, 정부의 피드백을 환영해요.

##Fable5##사이버보안##AI안전##앤트로픽

매일 핵심 AI 소식을 한국어로, 빠르게