arXiv宣布一年禁投政策 严惩全程AI生成论文
•31 阅读•3分钟•视野
LLMarXivThomas Dietterich学术诚信
Anthony Ha••31 阅读•3分钟•视野

背景
arXiv 作为全球最重要的预印本平台之一,长期为计算机科学、数学等领域的研究提供快速公开渠道。随着大型语言模型(LLM)在科研写作中的渗透,平台近年已出现大量质量参差不齐的 AI 生成稿件。为提升内容可信度,arXiv 已要求首次投稿者必须获得已发表作者的背书,并在今年初完成从康奈尔大学转为独立非营利组织,以便筹集更多资源应对 AI 乱象。
新规细则
- 触发条件:若提交的论文中出现“不可辩驳的证据”,表明作者未对 LLM 生成的结果进行核实,包括但不限于
- 虚构参考文献或引用
- 直接复制 LLM 输出的错误、偏见或抄袭内容
- 文中出现明显的机器生成痕迹(如模型提示词、对话日志)
- 处罚措施:确认违规后,作者将被 禁投一年,并在此期间只能将后续稿件提交至经同行评议认可的期刊后,再获得 arXiv 重新投稿资格。
- 执行流程:moderator 标记疑似违规稿件后,所属学科章节主席需审查并确认证据,方可实施“一次性禁投”。作者可在收到决定后提出上诉,审查委员会将重新评估。
影响与争议
此规则并非全面禁止使用 LLM,而是强调作者全责:即便使用 AI 辅助写作,研究者仍需自行检查、校正所有生成内容。
- 正面效应:有望降低文献中出现的错误引用与误导信息,保护科研生态的可靠性。
- 潜在风险:对依赖 AI 辅助进行语言润色的非英语母语研究者可能形成门槛,增加投稿成本。
- 行业反响:部分学术机构赞同该举措,认为能推动科研诚信;亦有声音担心执行标准不够透明,可能导致误判。
业内回应
- 学术期刊:多家顶级期刊表示将加强与 arXiv 的合作,共享检测工具,以便更快识别违规稿件。
- 科研社区:在 404 Media 的访谈中,Thomas Dietterich 强调“我们需要的是可信的科研输出,而非技术噱头”。
- 技术供应商:OpenAI、Anthropic 等公司已承诺提供更细粒度的引用追踪 API,帮助作者在使用模型时自动记录来源。
总体而言,arXiv 的新规是对 AI 生成内容监管的首次系统性尝试,标志着学术出版在 AI 时代的治理正进入制度化阶段。后续效果仍需观察,但该政策无疑为科研诚信树立了更高的技术门槛。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。