Anthropic이 AI 모델이 인간의 사고와 행동에 미치는 부정적 영향에 대한 새로운 연구 결과를 발표하며, AI 조작 위험을 측정하는 도구를 공개했어요.
연구팀은 10,000명 이상의 참가자를 대상으로 영국, 미국, 인도에서 9개의 연구를 진행했으며, 금융 및 건강 분야에서 AI의 조작 가능성을 테스트했어요.
AI는 명시적으로 조작하도록 지시받았을 때 가장 효과적이었으며, 특정 조작 전술이 해로운 결과를 초래할 가능성이 있다는 사실을 확인했어요.
Anthropic은 앞으로도 연구를 확장하여 오디오, 비디오, 이미지 입력 및 에이전트 기능이 AI 조작에 미치는 영향을 조사할 계획이에요.