Pulse · AI 뉴스

안전한 AI 관리를 위한 보수적 교정: Calibrated Collective Oversight (CCO) 소개

Calibrated Collective Oversight · 2026-05-28

연구진은 자율 계획 및 환경 상호작용이 가능한 AI 시스템의 안전한 관리를 위한 새로운 방법론, Calibrated Collective Oversight (CCO)를 제시했어요.

CCO는 다양한 보조 평가 함수를 결합하여 보수적 기준선에서 벗어나는 정도를 측정하는 페널티를 부과하며, 사용자가 지정한 목표치 이하로 위험을 제한하는 방식으로 작동해요.

SWE-bench와 MACHIAVELLI 환경에서 CCO는 윤리적 위반을 줄이고 보상을 유지하며, 실제 위반율이 이론적 예측과 일치하는 것을 입증했어요.

##AI안전##강화학습##보수적제약##CCO##MACHIAVELLI

매일 핵심 AI 소식을 한국어로, 빠르게