Anthropic이 Claude 모델의 정치적 편향을 줄이고 선거 관련 오용을 방지하기 위한 안전 장치를 강화한다고 발표했습니다.
Claude Opus 4.7과 Sonnet 4.6 모델은 정치적 스펙트럼 전반에 걸친 질문에 대해 각각 95%와 96%의 균형 잡힌 답변을 제공하는 것으로 평가받았습니다.
Anthropic은 모델 출시 전, 악의적인 사용 시나리오에 대한 테스트를 진행하며, 유용한 정보와 신뢰할 수 있는 자료를 제공하기 위해 노력하고 있습니다.
새로운 테스트에서 Claude Opus 4.7과 Claude Sonnet 4.6은 선거 관련 정책 위반 시도에 대해 각각 100%와 99.8%의 정확도를 보였습니다.
Anthropic은 또한 The Future of Free Speech와 같은 외부 기관과 협력하여 모델의 자유 표현 관련 행동을 검토하고 있습니다.