Anthropic이 Claude Code에 자동 승인 모드(Auto mode)를 새롭게 선보였습니다. 이 기능은 모델 기반 분류기를 활용하여 위험한 작업을 걸러내면서도 불필요한 승인 요청을 줄여 사용자 편의성을 높입니다.
자동 승인 모드는 입력 단계에서 악성 코드 삽입 시도를 탐지하는 프롬프트 주입 방지 기능과 출력 단계에서 작업 실행 전 안전성 평가를 수행하는 트랜스크립트 분류기 두 가지 방어막을 사용합니다.
Anthropic은 내부 모델 테스트를 통해 파악된 과도한 행동 및 실수로 인한 위험을 방지하는 데 중점을 두었으며, 이를 통해 사용자는 더욱 안전하고 효율적인 작업 환경을 경험할 수 있습니다.
자동 승인 모드는 기존 수동 검토 방식과 무단 통과 방식의 중간 지점에 위치하며, 사용자의 93%가 수동으로 승인하는 불필요한 단계를 줄여줍니다.
Anthropic은 자동 승인 모드가 모델의 판단 능력과 분류기 커버리지가 향상됨에 따라 시간이 지남에 따라 보안을 더욱 강화할 것으로 기대하고 있습니다.