Anthropic指控DeepSeek等伪造Claude账号并窃取1600万对话数据

事件概述

据《华尔街日报》报道，Anthropic在本周向外界透露，三家中国AI公司——DeepSeek、月之暗面（Moonshot AI）以及MiniMax——被指控利用超过24,000个伪造的Claude账号，系统性地抓取并提炼约1,600万条用户交互数据。Anthropic称，这些数据被用于训练自家的Claude系列模型，可能导致知识产权和隐私泄露。

涉事公司背景

DeepSeek（深度求索）是国内新锐大模型创业公司，近期推出的DeepSeek‑Chat在中文对话领域表现突出。
月之暗面（Moonshot AI）旗下的Kimi模型以轻量化和本地化部署为卖点，已在教育和企业市场获得一定份额。
MiniMax 是一家专注于多模态生成的初创企业，产品以高效的微调技术著称。

指控细节

Anthropic提供的证据显示，这三家公司在过去一年内通过自动化脚本批量注册Claude账号，随后利用这些账号调用Claude的API接口，获取大量真实用户的对话日志。

账号数量：累计超过24,000个，远高于正常企业合作的配额。
数据规模：约1,600万条交互记录，覆盖多语言、多场景的对话内容。
使用方式：据称这些数据被直接并入内部训练管线，用于提升模型的语言理解和生成能力。

法律与合规风险

如果指控成立，涉事公司可能面临以下风险：

侵犯数据使用协议：Claude的服务条款明确禁止未经授权的大规模数据抓取。
跨境数据合规：美国对涉及美国公民数据的跨境传输有严格监管，违规可能触发《美国出口管制条例》（EAR）或《欧盟通用数据保护条例》（GDPR）的审查。
商业诉讼：Anthropic已表明将保留采取法律行动的权利，包括索赔和要求停止侵权行为。

行业影响与后续走向

此事凸显了大模型竞争背后的数据安全争夺。随着模型规模的指数级增长，训练数据的质量与来源成为决定性因素。

竞争加剧：国内公司为缩短与OpenAI、Anthropic的差距，可能倾向于通过非正规渠道获取高质量数据。
监管呼声：业界专家呼吁在模型训练阶段引入更透明的数据审计机制，防止类似行为再次发生。
技术对策：Anthropic已表示将加强API访问监控，并探索使用水印技术追踪模型输出的来源，以提升防护能力。

结语

数据是大模型竞争的核心资产，任何未经授权的获取都可能触发法律与伦理的双重冲击。Anthropic的指控不仅是对个别企业的警示，也为整个AI生态敲响了合规的警钟。未来，监管机构、技术提供方以及行业协会需要共同制定更严格的数据治理标准，确保创新在合法合规的轨道上前行。