地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警
【导读】地球级智能体来了!谷歌把十多年世界建模经验,和Gemini的推理能力,装进了Earth AI。
地理AI,还得看谷歌!
谷歌首次实现地球尺度的复杂地理空间推理,把地球变成「可计算对象」。
基于数十年在世界建模上的经验,结合Gemini的先进推理能力,谷歌重磅升级Earth AI——
从环境监测到灾害响应,尽在其中。

谷歌地球AI「Google Earth AI」是一系列地理空间AI模型和数据集,其中包括由Gemini驱动的地理空间推理模型,可自动连接不同的地球AI模型——天气预报、人口地图和卫星图像——并回答不同的问题。
谷歌地球开外挂, 不止Gemini当导游
单个AI能力日益强大,但现实世界的问题常常需要融合跨领域知识。
台风可能在哪里登陆?哪些社区最不安全?应如何防台风?
要回答这类问题,需统筹处理影像、人口与环境数据,综合推理。
今年,谷歌推出的地球AI因此而生。
但这次,结合强大的基础模型与Gemini的空间推理智能体,谷歌首次实现了「地球尺度」的复杂现实问题推理能力。
基于真实世界数据,基础模型提供对地球的深度认知。
而智能体则扮演智慧指挥者角色:将复杂问题拆解为多步骤方案,通过调用基础模型、查询海量数据库、运用地理空间工具执行计划,最终融合各阶段成果形成整体解决方案。

今日,谷歌重磅推出Earth AI全新创新成果:
发布新一代影像与人口基础模型,并公布技术细节和评估报告
提出空间推理智能体

研究表明,借助地理空间推理,分析人员不再仅能预测风暴路径,更能一次性锁定最脆弱的社区与高危基础设施。
例如,非营利组织GiveDirectly通过融合洪水数据与人口密度信息,精准定位急需援助的受灾群体,提升救灾效率。
谷歌表示,自去年开始试点的集成对话功能,可帮助用户在卫星影像中发现目标与规律。例如,用户只需输入「查找藻华」,即可让谷歌地球监控饮用水源状况。
这项研究令人振奋之处在于它正在推动的重要AI落地应用:
波士顿儿童医院开展的精准社区健康干预,
GiveDirectly在灾害中快速定位最需援助的群体,
世界卫生组织非洲区预测霍乱暴发风险区的行动
空中客车通过检测植被侵占输电线路帮助客户预防停电,
以及芝加哥大学运用模型预测印度季风季来临,并与印度农业与农民福利部合作,向3800万农民发送精准预报。
谷歌也有实用的AI落地功能——
在2025年加州山火期间,谷歌向洛杉矶地区1500万人推送了危机警报,并在地图中实时显示可前往的避难所位置。

这些成果背后,正是谷歌在地理空间AI领域的深厚积累——其模型不仅用于洪水与山火预警,也涵盖气旋、空气质量等众多场景。
谷歌首次实现地球尺度的推理
在最新发布的技术论文中,谷歌首次公开「遥感基础模型」与「人口动力学基础模型」,并展示了地理空间推理智能体的强大能力:
智能地理推理:基于Gemini的智能体,可协调多维度Earth AI模型,解答复杂跨模态问题。
深度洞察升级:谷歌地球集成Earth AI模型+Gemini功能,支持用户通过自然语言在卫星影像中智能检索目标
云端开放接入:通过Google Cloud平台,向可信测试者直接开放Earth AI核心模型(影像/人口/环境)

传送门:https://arxiv.org/abs/2510.18318
Earth AI建立在多源、多模态的地理空间数据与工具基础上(下图左侧)。
之后,影像、人口与环境三大垂类领域子智能体与模型处理这些数据(下图中部)。
最终由Earth AI地理空间推理智能体(下图右侧)进行全局整合,从而实现全方位的地理空间分析与洞察生成。

三大基础模型:影像、人口、环境
遥感基础模型简化了三大核心能力, 加速了卫星影像分析。
首先,合成标注+网络获取的数据,构成了核心组件训练数据集。
训练好的视觉语言模型与开放词汇检测模型,可直接应用于分类、检测与检索任务;通过微调,视觉Transformer编码器则可提升下游特定任务的表现。

遥感基础模型的训练与应用流程,核心为视觉语言模型、开放词汇对象检测模型、预训练ViT编码器
用户可使用自然语言提出查询,即可获得快速精准的响应,如「找出暴雨后图像中被淹没的道路」。
基于海量高分辨率航拍影像与文本描述联合训练,在多项公开地球观测基准测试中,遥感基础模型取得突破性表现——
基于文本的图像检索任务平均提升超16%,而针对新类别物体的零样本检测精度,更达到基准线的两倍以上。

要深入理解人类活动与地理环境之间复杂的互动关系,需要研究涵盖「移动性AI」(Mobility AI)与「人口动力学基础模型」(Population Dynamics Foundations)等领域。
在这次研究中,人口动力学基础模型引入了两项关键创新:
1、覆盖17个国家的全球统一嵌入表示(embeddings);
2、按月更新的人类活动动态嵌入。
这些新特性对于时间敏感型预测尤为重要,因为它们能更精准地捕捉人类行为的变化节奏。
训练分为两阶段——
第一阶段为离线训练:通过整合多元地理空间数据(地图数据、搜索趋势、人流活跃度及环境条件),生成紧凑的区域嵌入表征。
第二阶段利用预训练嵌入,针对细分下游任务进行动态微调,实现局部统计数据的空间插值、外推、超分辨率重建及趋势预测等功能。

人口动力学基础模型双阶段框架
谷歌内部在17个国家的数据上评估了「人口动力学基础模型」,结果显示:在预测人口密度、树木覆盖率、夜间灯光强度和海拔高度四项指标时,各国R²评分(取值范围0-1,数值越高越好)均表现优异。

按美国邮政编码,谷歌可视化了人口动力学基础嵌入向量的各维度相似度。不同维度上的模式反映了美国人口的多样特征。

独立研究结果也验证了这一模型的强大性能。
比如,牛津大学的研究人员在预测巴西登革热传播时引入了该模型提供的嵌入表示,显著提升了长期预测的准确性——12个月的 R² 值(衡量模型对实际发病率解释程度的指标)从0.456提升至0.656。
之前,谷歌已实现中程天气预报、季风爆发预测、空气质量监测及河流洪水预警等领域的技术突破。
近期,更将环境模型升级至支持全球范围降水临近预报,并将重大河流洪水预警覆盖范围扩展至20亿人口。
地理空间推理智能体:解锁地球潜力
解决现实世界问题,需要融合多种专业模型的洞察。
地理空间AI的未来,不在于各自为政的单一模型,而在于由高级AI协调的、集成化的多模态生态系统。、
谷歌全新推出的Gemini驱动地理空间推理智能体,能够智能协调这些Earth AI的不同能力。
研究证实:多模型融合,预测能力更强。
Earth AI的终极目标是帮助用户解答需要跨模型、跨数据源多维推理的复杂现实问题。
此类查询可按复杂度分为三个层级:
描述与检索型询:事实查找,如「2020年8月,纽约最高气温记录是多少?」
分析与关联型查询:揭示不同数据源间的模式关联,如「卡特里娜飓风登陆时,路易斯安那州有多少医院位于遭受严重风暴影响的区域?」
预测或推断型查询:信息预测,如「到今年11月,印度哪些城市的脆弱人口面临最高的洪水冲击风险?」
为了解决三大复杂度类别的查询,谷歌专门设计了「地理空间推理智能体」。
为了迭代优化响应, 智能体不断重复「思考与规划→数据操作/模型推理/训练→反思与修正」循环,直至生成基于可靠依据的最终答案。

地理空间推理智能体运行框架
比如,当用户需要识别受风暴威胁的特定脆弱人群时,智能体通过以下透明化推理步骤实现精准分析:
环境风险建模:调用环境模型,精准划定受飓风级风力威胁的地理区域范围
人口密度分析:查询Data Commons人口统计库,识别预测登陆区内的高人口密度县市
行政边界匹配:从BigQuery公共数据集获取目标县市的官方行政边界数据
空间叠加计算:对风力影响区域与行政边界,进行几何空间交集运算
脆弱区域定位:基于人口动态基础模型与县级统计数据实时训练机器学习模型,精准定位最脆弱的邮政编码区域
关键设施识别:运用遥感基础模型的目标检测能力,在最脆弱区域的卫星影像中,自动识别医院、避难所等关键基础设施
这种分层推理机制将原始数据转化为应对灾害的决策知识,体现了多模态AI在应急管理领域的突破性应用。
为评估智能体性能,谷歌开发了两种创新评估方法:基于公开数据构建的问答基准测试(含可验证真实答案),以及面向复杂预测场景的危机响应案例研究。

Earth AI智能体将天气模型、人口数据与地理空间分析有机结合,实现自动化的灾害风险识别与可视化推理。
在问答基准测试中,地理空间推理智能体取得了0.82的综合准确率,显著优于Gemini 2.5 Pro(0.50)和Gemini 2.5 Flash(0.39)基线智能体。
这一结果印证了为智能体配备专业地理空间模型与工具对处理此类查询的关键价值。

创新永无止境
过去两周,从基因组学到量子计算乃至地理空间认知领域,谷歌研究院取得了一系列新成果。

这些突破完美印证了谷歌研究负责人Yossi Matias所提出的「魔法循环」研究模式:通过基础研究应对全球性挑战与机遇,并直接转化为现实应用方案。
这些方案不仅惠及全球数亿民众,更不断揭示出待探索的新课题。
研究是人类改善日常生活、应对社会挑战、把握时代机遇的必经之路,这也意味着科研与创新永无止境。

在更强的模型与智能工具驱动下,魔法循环正在加速运转,产生跨学科领域的连锁反应。
参考资料:
https://blog.google/technology/research/new-updates-and-more-access-to-google-earth-ai/
https://research.google/blog/google-earth-ai-unlocking-geospatial-insights-with-foundation-models-and-cross-modal-reasoning/
https://www.linkedin.com/feed/update/urn:li:activity:7387289443260436480/
https://arxiv.org/abs/2510.18318%20https://ai.google/earth-ai
声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。
游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。
AI 中文社