Google借助Gemini把新闻转为洪水预测数据,150国实时预警
•13 阅读•2分钟•应用
GoogleGeminiLLMFlood Hub
Tim Fernholz••13 阅读•2分钟•应用

背景与挑战
闪洪是致命且局部性极强的极端天气事件,传统气象站和雷达网络难以在所有地区实现高频监测,导致深度学习模型缺乏足够的标注数据。Google在此情境下提出,以文本资源弥补观测缺口的思路。
数据创新:Groundsource 数据集
- 数据来源:利用Gemini大模型对全球约500万篇新闻报道进行语义筛选,识别并抽取2.6百万条洪水事件。
- 结构化处理:将每条报道转化为带经纬度和时间戳的记录,形成名为 Groundsource 的地理时间序列。
- 公开发布:数据集于2026年3月首次对外开放,供科研机构和企业下载使用。
模型与平台实现
- 核心模型:基于长短期记忆网络(LSTM),输入全球气象预报数据并融合Groundsource标签,输出各地区闪洪发生概率。
- 平台部署:模型结果实时写入Google Flood Hub,覆盖约20平方公里网格,向150个国家的应急部门提供风险图层。
- 接口与共享:通过API向公共部门和合作伙伴开放,支持自定义阈值和地区筛选。
实际影响与局限
- 正面效应:南部非洲发展共同体的紧急响应官员报告称,新系统帮助其在数小时内调度救援资源。
- 技术局限:分辨率仅为20平方公里,且未整合本地雷达实时降雨数据,准确度仍低于美国国家气象局的洪水警报系统。
- 应用场景:项目专为气象基础设施薄弱、缺乏长期观测记录的地区设计,展示了“文本即数据”的可行路径。
业界视角
“数据稀缺是地球科学深度学习的最大瓶颈,这种从新闻中批量生成标注的做法极具创意。”——Upstream Tech CEO Marshall Moutenot
Google计划将此方法推广至热浪、泥石流等其他短时强度现象的预测,以构建更全面的气候风险数据库。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。