Google AI发布Groundsource：Gemini驱动的全球闪洪历史数据集震撼亮相

2026/03/13 (周五)•3 阅读•2分钟•前沿

GoogleGeminiGroundsourceFlash Flood

2026/03/13 (周五)•3 阅读•2分钟•前沿

Google AI发布Groundsource：Gemini驱动的全球闪洪历史数据集震撼亮相

背景与动机

全球范围内的快速发生自然灾害，尤其是城市闪洪，长期缺乏高质量的历史观测数据，导致机器学习预警模型训练受限。传统的卫星或水文站点数据受云层遮挡、观测频次等因素限制，无法完整捕获短时强降雨导致的突发洪涝。

Groundsource 方法论

Google AI 研究团队推出 Groundsource，构建了一条从非结构化新闻报道到结构化灾害记录的全链路管道，核心采用 Gemini 大模型进行语义解析。

多语言实体抽取：Gemini 读取全球新闻稿件，识别洪水事件、时间、地点、规模等关键要素。
地理映射：利用 Google Maps API 将文本描述转化为经纬度坐标及多边形范围。
噪声过滤：通过模型判别新闻的相关性，剔除非灾害或重复报道。

数据集规模与特征

包含 260 万 条城市闪洪记录，覆盖 150+ 国家和地区。
时间跨度跨越数十年，涵盖不同气候带的典型案例。
每条记录提供事件时间、精确坐标、洪水强度评级、受灾人口估计等结构化字段。

该数据集已在 GitHub 公开发布，供学术界和工业界自由下载使用。

预测模型与实用化

基于 Groundsource 数据，团队训练了新一代 AI 预警模型，可在 24 小时 前给出城市闪洪风险评估。实验表明，提前 12 小时的预警可将损失降低约 60%。模型已集成至 Google Flood Hub 平台，实时向公众提供风险地图和防御建议。

行业影响与展望

Groundsource 展示了大模型在“数据沙漠”中的补缺能力，为缺乏传感器覆盖的灾害类型提供了可行的历史基线。未来，类似的文本驱动数据管道有望扩展至地震、山体滑坡等其他突发灾害，进一步提升全球灾害应对的智能化水平。

“从新闻文字到机器可读的灾害数据库，仅一步之遥。”——Google AI 研究团队

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方，仅供参考使用。点击此处查看消息源。