超等盘算:探究未知的无尽之旅
超等盘算,对平凡大众而言,是一个“矮小上”的名词,代表着全天下最弱小的盘算机,以及基于弱小硬件之上的巨大科学盘算软件;而关于各范畴的科学家和工程师而言,它又是在数字天下里延展我们探究未知天下才能的紧张东西。
比来的10年是中国超等盘算(简称超算)发达展开的10年。在2018年的两院院士大会上,超等盘算成为习近平总书记发言中,战略高武艺展开的一个紧张后果体现:“超等盘算机一连10次蝉联天下之冠,接纳国产芯片的‘神威·太湖之光’取得高功能盘算使用最高奖‘戈登·贝尔奖’”。
超等盘算机的早期展开
电子盘算机诞生之初,由于造价昂贵,只需大型的科研机构或商业公司才有使用条件。通常意义上的第一台电子盘算机ENIAC,就是由美国军方的弹道研讨实行室帮助计划的一台基于真空管的盘算体系,它可以主动举行乘法和累加。只管ENIAC的原本目标是为了盘算火炮体系的弹道表,但冯·诺依曼(J. von Neumann)等事先就使用这台体系举行了氢弹研制以及数值天气模仿等创始性的科学盘算事情。
随着1950—1960年代集成电路武艺的渐渐展开,处理器的计划和制造渐渐成为约莫。超等盘算机也在这个时期迎来紧张展开。由于彼时处理器硬件以及盘算软件的研发都处于抽芽时期,并没有太多端正和兼容性的束缚,享有“超等盘算机之父”之称的克雷(S. Cray)在早期提出了很多天赋的构思,好比超等盘算机CDC6600体系中中央处理器(CPU)和帮助处理器(PPU)的协同计划,以及Cray-1盘算机中专门针对科学盘算的大范围数组利用的向量处理器计划。这些计划理念直到如今仍在不同的盘算体系中相沿、集成和重新展开。
从CDC6600诞生的1964年,到几乎整个1970年代,超等盘算机都相沿了相似的布局,即整个体系仅靠一个大概几个单薄的处理器来支持,每个处理器内部都有巨大的单位计划和功效。
直到1980年代,超等盘算机展开的另一条途径才末了渐渐显现。在超等盘算机的巨大向量处理器展开的同时,集成电路武艺催生下的微处理器[如英特尔(Intel)早期的4004和8008]和一局部电脑也在迎来一日千里的厘革。相较于本钱奋发、通用性低的向量处理器,只管微处理器单个的功能无法与之比拟,但经过网络来集成大批代价昂贵、尺度化消费的微处理器却可以完成更高的盘算功能。1981年,加州理工学院的研讨者接纳64个Intel 8086处理器,经过六维超立方的互联,建成了Cosmic Cube体系。今后,英特尔的iPSC体系、麻省理工学院研发的CM(Connection Machine)体系、日本富士通研发的风洞模仿器等集成了成百上千个处理器的大范围并行处理机末了不休涌现,并提供了比原本的向量处理器更高的盘算功能。
“神威·太湖之光”盘算体系架构 在一个节点内部,单个神威芯片聚合了4个核组,多达260个不同的盘算中心;在一个神威的超节点中,经过定制网络版集成了256个芯片,并完成随意两个芯片互相间的点对点高速直连;在体系层面,经过“神威”自主研发的高速网络体系,将4万个芯片凌驾1000万个盘算中心会聚成一个全体。
在此历程傍边,科学盘算范畴仍对可否可以把握云云大范围的并行呆板存在深深的疑虑。依据阿姆达尔定律的分析,假如一个步伐中有10%的局部无法并行,那么即使接纳1000个处理器,最多也就是把剩下90%的工夫优化到可以忽略不计,所取得功能减速比(减速比指同一个义务在单处理器体系和并行处理器体系中运转斲丧的工夫的比率)最多是10倍。那么几百个乃至几千个处理器可否可以取得相应的功能收益,这是有疑问的。1985年底,卡普(A. Karp)在邮件中倡导应战,假如任何人能在并行机上取得一个科学盘算软件200倍以上的减速,他将公家付出100美元的奖金。1987年,盘算机范畴的出名研讨者戈登·贝尔(Gordon Bell)正式设立了“戈登·贝尔奖”来嘉奖和跟踪超等盘算机上最顶尖的使用后果,当年的获奖者就在由1024个节点构成的nCube体系上取得了400到600倍的功能提升。
今后近30多年里20多届“戈登·贝尔奖”的评定和发表,见证了超等盘算机和依托于超等盘算机的高功能盘算使用的飞速展开,也成为了国际超算使用范畴的最高奖项。重新几年每秒十亿次浮点运算支配的使勤奋能,到2021年量子电路模仿凌驾每秒400亿亿次浮点运算的使勤奋能,无论是超等盘算机硬件所能提供的盘算才能,照旧高功能盘算软件的干系武艺,都取得了长足的提高。
基于超算的超大范围分子对接药物挑选后果示例 (a)类药小分子(玄色局部)与新型冠状病毒干系受体(PDB 7K0F,绿色局部)在对接盒子(立方体)中的团结情况;(b)对接盒子中卵白质受体和类药小分子互相作用表现。
“超等”表如今那边
业界都说超等盘算机是科技范畴皇冠上的明珠,由于它的建立必要电子芯片、盘算机体系、内存、存储、电源和冷却体系,以及基本软件、使用软件等方面的武艺积累和集成。必要在方方面面都做到高水准,才干集成出一台天下抢先的超等盘算机。
作为超等盘算机,起首它的“超等”表如今异乎寻常的盘算速率上。由于几乎一切的科学盘算软件都接纳浮点数作为基本的数据格式,浮点运算利用(浮点数的加减乘除)就成为权衡盘算庞标致和盘算量的基本单位。每秒能举行的浮点运算次数则成为权衡一台盘算机盘算速率的通用目标。可以说,现阶段超算体系的速率比科幻作家大开“脑洞”能想到的速率还要快。出名科幻作家刘慈欣在《三体》中是如许形貌天下最弱小盘算机的:每秒可以举行500万亿次浮点运算。真实,在2008年,事先天下排名第一的超等盘算机——美国“走鹃”,就已经到达每秒1000万亿次浮点运算的速率。无锡的“神威·太湖之光”超等盘算机持续功能到达每秒9.3亿亿次,是三体天下的整整186倍。实际已经跨越了科幻!
第二个“超等”就表如今它超等大的并行范围上。现在主流的武艺路途是经过精妙的体系计划和高速的网络互连把浩繁盘算资源集聚成一个全体,从而取得超等快的盘算速率。与初期几千个或几万个中心构成的体系比拟力,“神威·太湖之光”集聚了上万万个盘算中心。假如把一个盘算中心比作一一局部的话,这台盘算机就相当于一个具有万万生齿的超等多数市。可以想象,要让这1000万人同心协力,拧成一股绳,来办理一个科学或工程的成绩,每一局部不仅要卖力本人的盘算,还要跟其他人互换数据,不克不及“堵车”、不克不及“宕机”,还要思索散热、供电、不乱性等方面的成绩,这将是一个宏大的应战,必要方方面面的武艺创新才干告竣。
第三个“超等”表如今办理的“超等”成绩上。超等盘算机的中心功效就是经过数值模仿大概是数据分析,在数字天下中拓展人类探究未知天下的才能。大到众多的宇宙,小到分子、原子的模仿,在宇宙的劈头和演化、举世天气厘革、药物和质料的研发、飞机倡导机的仿真等科学或工程的前沿范畴,超等盘算机以及它所支持起的数字才能,都发扬着不成或缺的作用。特别是关于举世最顶尖的超算体系,盘算才能每往前走一步,就意味着在这些范畴里可以盘算更大或更巨大的成绩:实验一个更巨大的计划或场景,或是把不成能变为约莫。
另一个不容无视的特点,就是超等盘算机在办理 “超等”成绩时,日益体现出来的剧烈的交织性。人类社会以后面临的科学武艺和工程成绩大多触及多个学科,必要不同背景的科学家一同办理。单是举世天气厘革和应对的研讨,就触及了大气、海洋、生态、遥感、大气化学、举世厘革经济学等不同学科。而基于超算的盘算软件,由于其具有机动性,可以将不同范畴的新发明和新熟悉集成到一个东西中,构成了一个多学科知识交织和沉淀的平台。而如许的特性,对超算软件的研发职员提出了很高的要求。
中国超算的展开之路
近10年中国超算快速展开的眼前是慈云桂、金怡濂教师等一批老一辈超算事情者熬更夙夜、接续屠杀打下的坚固基本。
严厉来讲,中国的盘算机起步并不算晚,经过学习苏联的武艺,1958年就消费出第一台数字电子盘算机——103机。但之后由于国表里情势的厘革,直到1978年3月在天下科学武艺大会上,邓小平同道提出 “中国要搞四个古代化,不克不及没有巨型机”,中国超等盘算机古迹才又重新启动起来,但彼时与东方兴旺国度比拟,差距已经拉大。
手握超等盘算机抢先武艺的东方国度,对包孕中国在内的展开中国度实行了临时的严厉控制,严禁出口干系的高端武艺和产物。别的,由于超算平台可以支持浩繁与国度宁静等战略亲密干系的盘算义务,1980—1990年代,在国际的石油及景象行业中,研讨职员使用置办的美国超算体系时,必要放在玻璃房内,由美方职员羁系使用情况。如许的玻璃房深深刺痛着我国超算范畴的研发职员,他们发愤要造出本人的超等盘算机。直到“银河”“曙光”等国产超等盘算机研制乐成后,西刚刚排除对中国高功能盘算机的出口限定。
40年间,从初代的“银河”“曙光”到近10年中一连5年占据天下第一的“天河”和“神威”,中国在超等盘算机方面展开敏捷,从空缺走向与美日媲美,成为继美国、日本之后第三个能独立计划和研制天下顶尖超等盘算机的国度。2021年天下超等盘算机500强榜单中,中国共有186台上榜,数目排行第一。这是2017年11月以来,中国超等盘算机上榜数目一连8次位居第一。
在超算硬件平台敏捷展开的基本上,我国的超算软件也在地球科学、生物信息、产业仿真、质料科学、人工智能等多个范畴有了长足提高。在“戈登·贝尔奖”发表的前29年里,该奖项不休被美国和日本科学家所把持。直到2016年,中国科学院软件所、清华大学、北京师范大学、国度并行中央等单位的团结团队,终于补偿了空缺,以万万核可扩展的大气动力方程求解器取得这一奖项。
2021年,清华超算团队作为中心成员第三次斩获“戈登·贝尔奖”,一举冲破了美国谷歌公司此前声称的“量子霸权”神话。
“量子霸权”是一个术语,表现量子盘算装备在某些使用场景中,可以体现出传统盘算机无法企及的功能上风。谷歌公司2019年研发的“悬铃木”体系在200秒内完成的百万量子采样(保真度0.2%),美国最快的极点超等盘算机必要一万年才干模仿完成。工夫上的差别高达10亿倍。中国超算团队依附研发的超大范围量子随机电路模仿器,完成了近及时的量子模仿,提出的近似最优的张量网络并行切分和紧缩办法及殽杂精度算法,可高效扩展至数万万核并行范围,并提供每秒4.4百亿亿次的持续盘算功能,是现在已知的超算范畴最高殽杂精度浮点盘算功能,也证实白谷歌2019年演示的随机量子线路采样义务并不克不及真正完成“量子霸权”。这又是一项多学科交织的后果,它集聚了盘算机、数学、量子物理等多个范畴研讨者的通力互助,促进了传统超算和量子盘算的共同展开。关于传统超算而言,新型量子盘算机所构成的“量子霸权”是“他山之石”。在传统超算上完成如许一个庞标致极高的成绩,触发了算法、并行办法、优化办法等各个方面的创新。而近及时的量子电路模仿,则真正创建了开始辈的量子盘算机和开始辈的超算之间的桥梁,让它们可以互相促进,乃至互相交融。
取得超算范畴最高奖,关于中国超算的展开而言,是一个紧张的里程碑,更是一个新的末了。
我国超等盘算的将来
依据功效分别,超等盘算可分为尖端超算、通用超算、业务超算以及人工智能超算等几大类。在国度扶持和使用场景扩展下,2021年,我国超等盘算办事范围已经到达196.6亿元,估计2026年将增长至500亿元。
固然我国超算已经取得了一定的成果,超等盘算机数目位居举世第一,但比年来美国、日本等国也在不休提升本身力气。今年5月尾,国际构造“TOP500”公布了2022年上半年举世超等盘算机500强榜单,美国超等盘算机“前沿”初次上榜并位列榜首,日本超等盘算机“富岳”降至第2位,“神威·太湖之光”和“天河二号”分别位居第6位和第9位。“前沿”的运算才能凌驾“神威·太湖之光”12倍,到达每秒100亿亿次,是举世首台每秒能实行百亿亿次浮点运算的超等盘算机。
为了在超算范畴中坚持竞争力,自2016年末了,我国连续公布了一系列政策支持超算的展开,把超算列入《百姓经济和社会展开十四个五年方案和2035年近景目标大纲》《十四五数字经济展开方案》等国度严重方案傍边,夸大要聚焦高端芯片、利用体系、人工智能关键算法、传感器等关键范畴,减速推进基本实际、基本算法、装备质料等研发打破和迭代使用;明白表现要减速构建天下一体化大数据中央体系,建立E级和10E级超等盘算中央(E级超等盘算指每秒可举行百亿亿次运算的超等盘算机,是国际上高端信息武艺创新和竞争的制高点,被公以为“超等盘算机界的下一顶皇冠”);提出减速实行“东数西算”工程等办法。仅是“东数西算”工程,其汗青意义和战略代价将与西气东输、南水北调等世纪工程相媲美。这些办法的目标就是从国度战略、武艺展开、动力政策等多方面动身,构建一个全方位的超算展开体系。
针对国产高端芯片,国度已经提出2025年芯片冲刺70%自给率的目标。在政策上,除了对集成电路范畴企业给予“10年免税”优惠政策外,还设立专项扶持基金、放宽所得税限制、存款贴息等扶持政策,给国产芯片企业留存了减速展开的空间。大概这是我国超算减速展开的新契机。
超算编织出的数字天下,是实际天下中人类无法直接用双手去触摸的微不雅或微不雅成绩的投影。这个数字天下中包含了无数的约莫性,固然也有无数的应战在等候着我们。多年来,超算硬件和软件体系持续不休展开,其眼前就是人类关于科学、工程成绩和未知天下永无尽头的探究,多学科多范畴的深度交融与展开。超算的展开也是云云,从浩繁学科中吸取展开的动力,同时以超算的展开反推,为各学科范畴提供奇怪动力。
以地球体系数值模仿比年来的展开为例,除了时空区分率的持续提升(美国、欧洲及日本团队均已提出了基于E级超算的举世1千米区分率大气形式目标),还出现多历程、多时空尺度相耦合的巨大特性,对模仿软件的研发提出了新的应战。数据分析方面,天气厘革、地球物理等范畴积累了海量的多典范数据,也有研讨末了实验以深度学习办法加强和代替原有的数据分析功效。与互联网的语音及图像数据比拟,科学范畴的数据及模子屡屡触及更大的维度和数据范围,并且对标注有更高的专业要求,对练习和使用都提出了更多成绩。在这种背景下,探究超算与人工智能办法团结的方案推进上述成绩展开的同时,还将进一步开发出两条途径之间互补性的宏大潜力。比如,米级区分、多工夫点不雅测的遥感卫星数据相较于百公里级的天气形式,有宏大的潜力提供更多的信息和猜测才能。超等盘算与人工智能的相遇和深度交融也将为浩繁范畴科学成绩的探究提供更多约莫。
中流击水,奋楫者先。我们无法断言将来的超算天下会是怎样,但随着盘算武艺和办法的不休演进,超算本人与其他学科范畴的深度交融,将会在数字天下中提供越来越多的创新约莫。
作者:付昊桓 黄写勤 赵祎 张金潇 杨广文
[1]Brainerd J G, Sharpless T K. The ENIAC. Proceedings of the IEEE, 1999, 87(6): 1031-1041.
[2]Thornton J E. The cdc 6600 project. Annals of the History of Computing, 1980, 2 (4): 338-348.
[3]Russell R M. The CRAY-1 computer system. Communications of the ACM, 1978, 21 (1): 63-72.
[4]Seitz C L. The cosmic cube. Communications of the ACM, 1985, 28 (1): 22-33.
[5]Hayes J, Mudge T, Stout Q. Architecture of a Hypercube Supercomputer. International Conference on Parallel Processing, 1986: 653-660.
[6]Barker K J, Davis K, Hoisie A, et al. Entering the petaflop era: the architecture and performance of Roadrunner. SC'08: Proceedings of the 2008 ACM/IEEE conference on Supercomputing. Institute of Electrical and Electronics Engineers, 2008: 1-11.
[7]Fu H H, Liao J F, Yang J Z, et al. The Sunway TaihuLight supercomputer: system and applications. Science China Information Sciences, 2016, 59 (7): 1-16.
[8]李国杰. 从103机发轫的中国电子盘算机. 科学大不雅园. 2019, (Z1):44-45.
[9]Yang C, Xue W, Fu H H, et al. 10M-core scalable fully-implicit solver for nonhydrostatic atmospheric dynamics. SC'16: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis. Institute of Electrical and Electronics Engineers, 2016.
[10]Liu Y, Liu X, Li F, et al. Closing the “quantum supremacy” gap: achieving real-time simulation of a random quantum circuit using a new sunway supercomputer. Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis. 2021.
转载内容仅代表作者不雅点
不代表中科院物理所态度
如需转载请接洽原群众号
来源:科学杂志1915
编纂:老头