Pulse · AI 뉴스

Anthropic, 경쟁사 모델 학습을 위한 Claude 능력 불법 추출 방지 조치

Anthropic · 2026-02-23

Anthropic이 DeepSeek, Moonshot, MiniMax 등 3개 AI 연구소의 Claude 능력 불법 추출 시도를 적발하고 대응 조치를 발표했습니다.

이들 연구소는 약 2만 4천 개의 허위 계정을 통해 1600만 건 이상의 Claude와 교류하며 모델의 기능을 불법적으로 추출했습니다. 이 과정에서 '증류(distillation)'라는 기술이 사용되었습니다.

증류는 Claude의 출력을 활용하여 다른 모델을 학습시키는 방식으로, 안전장치가 없는 모델이 생성되어 국가 안보 위험을 초래할 수 있으며, 미국 모델의 기술력이 해외로 유출될 수 있다는 우려가 제기되었습니다.

Anthropic은 이러한 불법 추출을 막기 위해 수출 통제를 지지하며, 관련 공격에 대한 가시성을 확보하고 있습니다.

DeepSeek는 Claude의 추론 능력과 정치적으로 민감한 질문에 대한 회피 방법을 추출하는 데 집중했으며, Moonshot은 에이전트 기능과 코딩 능력을, MiniMax는 에이전트 코딩 및 도구 사용 능력을 목표로 했습니다.

##모델보안##AI윤리##Anthropic

매일 핵심 AI 소식을 한국어로, 빠르게