Anthropic指控DeepSeek等伪造Claude账号并窃取1600万对话数据

14 阅读3分钟视野
Anthropic指控DeepSeek等伪造Claude账号并窃取1600万对话数据

事件概述

据《华尔街日报》报道,Anthropic在本周向外界透露,三家中国AI公司——DeepSeek、月之暗面(Moonshot AI)以及MiniMax——被指控利用超过24,000个伪造的Claude账号,系统性地抓取并提炼约1,600万条用户交互数据。Anthropic称,这些数据被用于训练自家的Claude系列模型,可能导致知识产权和隐私泄露。

涉事公司背景

  • DeepSeek(深度求索)是国内新锐大模型创业公司,近期推出的DeepSeek‑Chat在中文对话领域表现突出。
  • 月之暗面(Moonshot AI)旗下的Kimi模型以轻量化和本地化部署为卖点,已在教育和企业市场获得一定份额。
  • MiniMax 是一家专注于多模态生成的初创企业,产品以高效的微调技术著称。

指控细节

Anthropic提供的证据显示,这三家公司在过去一年内通过自动化脚本批量注册Claude账号,随后利用这些账号调用Claude的API接口,获取大量真实用户的对话日志。

  • 账号数量:累计超过24,000个,远高于正常企业合作的配额。
  • 数据规模:约1,600万条交互记录,覆盖多语言、多场景的对话内容。
  • 使用方式:据称这些数据被直接并入内部训练管线,用于提升模型的语言理解和生成能力。

法律与合规风险

如果指控成立,涉事公司可能面临以下风险:

  1. 侵犯数据使用协议:Claude的服务条款明确禁止未经授权的大规模数据抓取。
  2. 跨境数据合规:美国对涉及美国公民数据的跨境传输有严格监管,违规可能触发《美国出口管制条例》(EAR)或《欧盟通用数据保护条例》(GDPR)的审查。
  3. 商业诉讼:Anthropic已表明将保留采取法律行动的权利,包括索赔和要求停止侵权行为。

行业影响与后续走向

此事凸显了大模型竞争背后的数据安全争夺。随着模型规模的指数级增长,训练数据的质量与来源成为决定性因素。

  • 竞争加剧:国内公司为缩短与OpenAI、Anthropic的差距,可能倾向于通过非正规渠道获取高质量数据。
  • 监管呼声:业界专家呼吁在模型训练阶段引入更透明的数据审计机制,防止类似行为再次发生。
  • 技术对策:Anthropic已表示将加强API访问监控,并探索使用水印技术追踪模型输出的来源,以提升防护能力。

结语

数据是大模型竞争的核心资产,任何未经授权的获取都可能触发法律与伦理的双重冲击。Anthropic的指控不仅是对个别企业的警示,也为整个AI生态敲响了合规的警钟。未来,监管机构、技术提供方以及行业协会需要共同制定更严格的数据治理标准,确保创新在合法合规的轨道上前行。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。