天气预报哪个好用哪个最准确(DeepMindAI中期天气预报吊打全球顶级气象台,1分钟预测10天天气)

DeepMindAI中期天气预告吊打举世顶级景象台,1分钟猜测10每天气

编纂:好困 Aeneas

【新智元导读】「中期天气预告」由于数据量太大,猜测模子的质量不休是个困难。比来,DeepMind和谷歌推出的全新呆板学习模子,以凌驾99%的上风在天气预告模子中胜出。


众所周知,传统天气预告的可靠性,几多都有些一言难尽。

比来,DeepMind和谷歌新研讨出了一种基于呆板学习的天气模仿器,可以在60秒内猜测10天内的天气,并且准确率极高!

论文地点:
https://arxiv.org/abs/2212.12794

1. GraphCast是一种基于图神经网络的自回归模子,功能优于天下上最准确的呆板学习天气预告体系(中期天气预告);

2. GraphCast只需单台Cloud TPU v4装备,即可在60秒内天生10天内的天气预告(35GB数据),区分率高达0.25°;

3. 经过在更大、更新、质量更高的数据上举行练习,可以进一步提升GraphCast猜测的速率和准确性。

而在短期天气预告方面,DeepMind曾于2021年9月在Nature上发文称,其天生模子能以89%的相对上风吊打其他办法。

中期天气预告为什么那么难

「中期天气预告」通常是指对将来于4至10天内天气厘革趋向的预告。其准确性,关于农业、修建业、旅游业等行业的政策订定来说至关紧张。

为此,国际抢先的欧洲中期天气预告中央(ECMWF), 天天都市提供多达四次的中期天气预告。

在中期天气预告的制造历程中,有两个关键的构成局部都必要使用大范围高功能盘算(HPC)集群举行模仿:

  • 通太过析由卫星、景象站、船舶等搜集的以后和汗青数据来猜测天气情况,也就是「数据同化」;
  • 经过数值天气预告(NWP)体系创建猜测天气干系变量将怎样随工夫厘革的模子。

但是,随着数据量的明显增长,NWP模子却无法失掉无效的扩展。

也就是说,固然如今有大批的天气不和候不雅测档案,但我们却很难直接使用这些数据来提高预告模子的质量。

而改良NWP的办法,寻常是由练习有素的专家手动创造更好的模子、算法和近似值,这个历程耗时耗力,本钱奋发。

比拟之下,基于呆板学习办法可以使用更多、更高质量的可用数据来提高模子的准确性,并且盘算预算通常要低得多。

GraphCast

在论文「GraphCast:中期举世天气准确预告学习」中,DeepMind以「编码-处理-解码」的办法使用图神经网络(GNN)来创建一个自回归模子。

GraphCast的三阶段模仿历程如下:

1. 使用从网格点到多网格的有向边的GNN,将原始经纬度网格的输入数据映射到多网格上的学习特性中;

2. 一个深度GNN被用来在多网格上举行学习的信息转达,此中长距离的边允许信息在空间上无效转达;

3. 解码器将终极的多网格表现映射回经纬度网格,并实行任何必要的利用。

研讨后果体现,GraphCast的功能在252个变量中,有99.2%凌驾了现有最准确的呆板学习天气预告模子;在2760个变量中,有90%凌驾了欧洲景象中央的高精度预告(ECMWF HRES Forecast)。

(a) 输入的天气形态是在高区分率的纬度-经度-气压层网格上确定的。

(b) GraphCast猜测天气的下一个形态是纬度-经度-压力级网格。

(c) 经过迭代地将GraphCast使用于每个先前的猜测形态,以产生一连串的形态,将天气表现为一连的延迟量。

(d) GraphCast架构的编码器组件将输入的局部地区(绿色方框)映射到多网格图的节点。

(e) 处理器组件使用所学的消息转达来更新每个多网格节点。

(f) 解码器组件将颠末处理的多网格特性(紫色节点)映射到网格表现上。

ERA5数据集

GraphCast在39年(1979年-2018年)汗彼苍气数据的语料库上举行了练习,即ECMWF的ERA5再分析数据集。

模子以6小时的工夫步长,在0.25°经纬度区分率下,对5个地表变量和6个大气变量举行10天的猜测,每个变量在37个垂直压力层上,代表了特定地点和工夫的天气形态。

如图1a所示,研讨职员将工夫指数t处的天气形态表现为

围绕地球的网格对应每个纬度、经度和压力级别的变量。外表和大气变量分别由减少视图中的黄色和蓝色框表现。

我们将

中对应于特定网格点(统共有1,038,240个)的变量子集称为

,并将227个目标变量中的每个变量称为

天生猜测

GraphCast 将两个天气形态

作为输入,它们分别对该以后工夫t,和前一个工夫t-1,并猜测下一个工夫步长的天气形态(如图1b所示)。

为了天生T-step猜测

,GraphCast以自回归办法迭代上图的等式,将本人的猜测作为输入,来猜测前面的步长(即,猜测步长t+2,输入为

;猜测步长 t + 3,输入为

图1b、c形貌了这个历程。

架构

GraphCast的中心架构在「编码-处理-解码」设置中使用GNN,如图1d、e、f所示。

基于GNN的学习模仿器在学习流体和其他质料的巨大物理动力学方面十分无效,由于它们的表现和盘算布局相似于无限元学习求解器。

GNN的一个关键上风是,输入图的布局决定了表现的哪些局部经过学习的消息转达互相交互,从而允许在任何范围内举行随意形式的空间交互。

比拟之下,卷积神经网络 (CNN) 仅限于盘算局部patch内的交互(大概,在扩张卷积的情况下,有纪律地超过更长的范围)。

而Transformer固然也可以完成随意的近程盘算,但是在输入十分大的情况下,它们不克不及很好地扩展(要晓得,GraphCast的全局输入中有凌驾100万个网格点),由于盘算中all-to-all的交互,会惹起很巨大的二次影象。

Transformer的今世延伸通常会希罕化约莫的交互,以低落巨大性,这使它们实践上相似于GNN。

经过引入GraphCast的内部多网格表现,研讨职员使用GNN的才能,模仿了随意希罕的交互办法。

它在全局范围内具有匀称的空间区分率,并允许在多数消息转达步长内举行长距离互动。

要布局一个多网格,起主要将一个常规的二十面体(12个节点和20个面)迭代6次,失掉一个二十面体网格的条理布局,在最高区分率下共有40,962个节点和81,920个面。

由于粗网格节点是细网格节点的子集,研讨职员可以将网格条理布局中的各级边沿,叠加到最小区分率的网格上。

这个历程产生了一个多尺度的网格集,粗边在多个尺度上弥合了长距离,细边捕捉了局部的互相作用。

图1g体现了每个单独的细化网格,而图1e体现了完备的多网格。

使器具有从网格点到多网格的定向边的GNN,GraphCast的编码器(图1d)起首将原始经纬度网格的输入数据,映射为多网格上的学习特性。

然后,处理器(图1e)使用一个16层的深度GNN,在多网格上举行学习的信息转达,由于长距离的边沿,信息可以在空间上被无效转达。

然后,解码器(图1f)使器具有定向边沿的GNN,将终极的多网格表现映射回经纬度网格,并将该网格表现?+与输入形态?+相团结,构成输入猜测,?++1 = ?+ + ? +。

练习历程

GraphCast被练习成在12步猜测(3天)中对ERA5目标举行目标函数最小化,使用的是梯度下降法。

目标函数如下——

研讨职员使用批处理并行武艺,在32台Cloud TPU v4装备上花了约莫3周工夫对GraphCast举行了练习。

为了增长内存占用,研讨职员还使用了巨大的梯度反省点战略和低精度的数值。

后果

后果体现,GraphCast在0.25°区分率的10天预告中,单方面跨越了HRES天气预告武艺。

如图4所示,GraphCast(蓝线)在10个主要地表和大气变量上,都分明优于HRES(黑线)。

别的,研讨职员经过地区分析标明,这些后果在整个地球上是一律的。

依据评价的后果,GraphCast在2760个变量、品级和前置工夫(4个地表变量,加上5个大气变量×13个品级,历时10天,天天4个步长)中的90.0%体现优于HRES。

研讨职员表现,HRES在高层大气级别上的体现屡屡比GraphCast好,特别是压力级别50hPa,这并不奇异,由于使用于50hPa或以下压力级别的总练习丧失权重只占一切变量和级别总丧失权重的0.66%。

当扫除50hPa水平常,GraphCast在2240个目标中优于HRES的百分比为96.6%;当扫除50和100hPa水平常,1720个目标中的百分比为99.2%。

10u的真实天气和猜测天气

第1行体现ERA5,第2行体现HRES,第3行体现GraphCast,第4行和第5行分别是HRES和HRES-fc0、GraphCast和ERA5之间的偏差相对值图。底部的图体现了HRES和GraphCast的RMSE水平。

msl的真实和猜测的天气形态

自回归练习对猜测的影响

当用较少的自回归步长练习时,模子在较短的前置工夫内体现较好,而在较长的前置工夫内体现较差。

随着自回归步数的增长,在较短的前置工夫内功能变差,但在较长的前置工夫内功能变好。

GraphCast与顶级ML猜测模子的功能比力

现在,基于ViT的Pangu-Weather代表了基于ML的天气预告的最新水平,其盘算形式与GNN相似。

GraphCast与Pangu-Weather的比力后果如图8所示。第1行和第3行体现GraphCast(蓝线)、Pangu-Weather(红线)、HRES对HRES-fc0的评价(黑线)和HRES对ERA5的评价的相对RMSE;第2行和第4行体现各模子之间干系于Pangu-Weather的归一化RMSE差分。

总结一下

GraphCast模子在10天的预告中,在6小时步长和0.25°经纬度区分率下,凌驾了现在最准确的确定性体系——ECMWF的HRES。

针对2760个变量、压力品级和前置工夫的组合举行评价的后果体现,GraphCast模子在90.0%的目标上比HRES的RMSE低。

当扫除了100hPa及以上的高层大气场时,GraphCast在1760个目标中的99.2%体现优于HRES。

别的,在252个目标中,GraphCast有99.2%凌驾了之前最好的ML基线——Pangu-Weather。

GraphCast的一个关键创新是其新奇的「多网格」表征办法,这使得它可以捕捉到比传统的NWP办法更长的空间互动,从而支持更粗的原始工夫步长。

这就是为什么GraphCast可以在一个Cloud TPU v4装备上以6小时为单位在60秒内天生准确的10每天气预告的局部缘故原因。

参考材料:

https://arxiv.org/abs/2212.12794

内容底部广告位(手机)
标签:

管理员
草根站长管理员

专注网站优化+网络营销,只做有思想的高价值网站,只提供有担当的营销服务!

上一篇:两只老虎(儿歌《两只老虎》的前世今生)
下一篇:返回列表