DeepMind发布AlphaGenome 能预测上百万碱基的基因调控
•32 阅读•2分钟•前沿
DeepMindAlphaGenome基因组
•32 阅读•2分钟•前沿

重大发布
DeepMind 今日在《Nature》发表论文,推出 AlphaGenome,标志着 AI 在基因组学领域实现了突破性进展。AlphaGenome 采用超长上下文窗口,单次推理可覆盖约 1,000,000 个 DNA 碱基,对人类和小鼠基因组均进行了大规模预训练。
模型技术细节
- 超长序列窗口:一次性处理约 1M 碱基,突破传统模型只能处理几千至数万碱基的限制。
- 多任务预测:同时输出基因表达、可变剪接、染色质开放度、增强子-启动子相互作用等 25 种基因组信号。
- 跨物种学习:模型在人类和小鼠基因组上共同训练,提升对保守调控元件的捕获能力。
- 开放权重:DeepMind 已在 GitHub 公布模型权重,研究者可自行下载或通过 AlphaGenome API 调用。
性能与评测
AlphaGenome 在 26 项公开基准任务中有 25 项超越或匹配现有最先进模型,尤其在非编码区的调控预测上表现尤为突出。非编码 DNA 占人类基因组约 98%,其变异是多数疾病关联位点的来源,AlphaGenome 的高精度预测为疾病机制解析提供了重要线索。
开放与行业影响
- 科研加速:开放模型与 API 将帮助基因组学实验室快速筛选功能变异,加速罕见疾病基因定位。
- 药物研发:制药公司可利用预测的调控网络评估潜在靶点,提高新药研发的成功率。
- 基因疗法:精准的调控图谱为基因编辑提供安全性评估,降低脱靶风险。
DeepMind 表示,AlphaGenome 仅是大模型赋能生命科学的开端,后续将继续扩展至更长序列、更复杂的表观基因组数据,推动 AI 与生物医学的深度融合。
“AI 正在帮助我们从基因组的‘暗物质’中读出功能信息,这将彻底改变医学研究的范式。”——DeepMind 研究负责人
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。