探访中国超算“下一顶皇冠”:核心器件全部国产
来源:环球时报
随着日本8月底宣布下一代超算将在2021年问世,中国、美国、日本和欧洲在超算领域的竞争日趋白热化,各方角逐的新战场转移到运算速度达每秒百亿亿次的E级超算。为争夺“超算界的下一顶皇冠”,中国的E级超算研制计划已全面展开。近日,《环球时报》记者独家探访部署有“神威”E级超算原型机的国家超算济南中心,亲眼目睹下一代“国之重器”。
走近“神威”E级原型机
噪音与低温,这是《环球时报》记者走进国家超算济南中心机房的第一感受。这里部署着中国首台全部采用国产处理器和系统软件构建的千万亿次计算机——“神威·蓝光”。一个月前,“神威·蓝光”迎来一个新邻居——“神威”E级超算原型机。
虽然E级超算被誉为“超算领域的下一顶皇冠”,但其原型机却“貌不惊人”。“神威”E级超算原型机目前只是一台一人多高的纯黑色机柜,上面印有金色的“神威 E级原型系统”字样。打开原型机的机柜门,里面整齐分布着32个运算超节点,每个超节点又由8个申威众核处理器构成。
作为原型机,虽然它的体积不大,但相比由9个机柜组成的“老前辈”“神威·蓝光”,“神威”E级超算原型机的浮点运算速度达每秒3000万亿次,是“神威·蓝光”的3倍,相当于我国最强超算“神威·太湖之光”运行速度的1/30。
据国家超算济南中心主任张云泉介绍,“神威”E级超算原型机实现了完全自主可控——处理器、网络交换芯片、消息处理芯片等核心器件全部实现国产化。运算系统全部采用具有完全自主知识产权的申威众核处理器;高速互连网络系统全部采用完全自主知识产权的申威网络芯片构建;存储和管理系统采用申威多核处理器构建,实现了对该领域产品的国产化替代。
中国E级超算的三条路径
早在2016年前后,中国已经启动E级超算的研发计划,同时开始3种技术路径的探索:国家超算天津中心同国防科技大学联合研制的“天河三号”E级超算原型机已于7月22日在天津完成部署,国家并行计算机工程技术研究中心联合国家超算济南中心研发的“神威”E级超算原型机于8月5日在济南正式启用。此外,中科曙光也在进行E级超算的研制,但暂时还未披露该项目的进展。
国家超算济南中心副主任潘景山向《环球时报》记者介绍称,2016年至2018年是中国E级超算规划中的第一步,即进行原型机的研发。这一阶段完成后,三家的E级超算将进行PK,通过“赛马机制”确定其中两家并制造出两台真正的E级超算。“根据计划,拥有每秒百亿亿次运算速度的‘神威’E级超算将在2020年正式发布。”
虽然都是走众核路线,但张云泉告诉《环球时报》记者,三家的研发路径却不尽相同。根据此前披露的消息,中科曙光的E级超算原型机采用了自主X86架构处理器和加速器的异构众核体系架构。有分析认为,虽然X86处理器的技术相对成熟,但要将其完美移植到中国的E级超算上,达到较高的性能,依然存在不小的难度。
相比中科曙光,“天河三号”E级超算的原型机采用了“多模融合加速架构”,即同时使用国产飞腾FT2000+处理器和迈创Matrix 2000+加速器。据张云泉介绍,“天河三号”的架构中既有专门的飞腾芯片分区,也有迈众芯片分区,二者既可以单独运行,也可以合力运行。
与“天河三号”原型机处理器+加速器的松散耦合架构相反,“神威”E级超算的原型机采用了紧耦合的“同构众核”架构,在国产的申威26010+处理器中采用四个主核带256个从核的架构。张云泉对《环球时报》记者表示,“神威”的集成度更高,功耗更低,但挑战在于并行编程的难度会提升。“不过根据国际业界预测,未来最合适E级超算的架构应该就是‘胖核’+‘瘦核’。”
中美日欧,都在抢第一
在美国超算“顶点”于今年6月超过“神威·太湖之光”、重夺全球超算第一后,中美之间的超算之争更加趋于白热化,对于下一代E级超算,两国都展示出“势在必得”的姿态。
据美国媒体披露,美国第一台E级超算代号为“A21”,未来计划部署在美国阿贡国家实验室,于2021年投入使用。不久前,美国又宣布2个新的E级超算计划,其中一台将采用与A21不同的架构,部署在橡树岭国家实验室;计划部署于劳伦斯·利弗莫尔国家实验室的E级超算则可能采用一种全新架构。
日本的E级超算研制则基于目前的超级计算机“京”。2016年,富士通和日本理化学研究所宣布为日本开发首台E级超算——“后京”,并计划在2020年部署。但不久后,该项目负责人石川裕博士承认,“后京”的部署可能会延迟。
相较中美日的E级超算研制已经给出明确的时间表,欧洲的E级超算却迟迟没有眉目。张云泉向《环球时报》记者介绍称,由于欧洲超算此前一直采用美方技术,缺少自主核心技术,因此目前虽然有了E级超算计划,但没有看到实质性进展。
“目前来看,中国E级超算计划于2020年完成部署,应当是走在了世界的最前列”,张云泉对《环球时报》记者表示,但可以预期的是,在未来十年,中美在超算领域交替领先的格局不会出现根本性改变。
尽管在超级计算机研发本身,中国毫无疑问处于第一梯队,但潘景山对《环球时报》 记者表示,从超算的整体生态来看,中国依然与美国存在差距,业界也在共同努力,希望尽快打造属于我国的超算应用生态。
未来应用要“顶天立地”
超级计算机可谓是“国之重器”,即使抛开数额巨大的研发费用不提,每台超算每年的用电都需要花费上亿元,这让不少民众都提出一个疑问:普通人如何从下一代E级超算中受益?
“对于E级超算的应用,我们的思路是‘顶天立地’”,张云泉对《环球时报》记者解释道,一方面,超算需要服务国家战略,为科学研究提供计算能力。以计划部署在山东的“神威”E级超算为例,它将为国家海洋强国战略构建“深蓝大脑”,支撑海洋和气候预测、海洋药物智能筛选、海底战略性资源智能勘探、海洋生态系统演变预测、海洋大数据智能分析等应用。
另一方面,“神威”E级超算还将立足济南,服务全国,解决健康医疗、先进制造、航空航天、气候气象、生物信息、新能源新材料等一批国家科学与工程计算领域的重大课题,为国家经济建设提供国际领先的计算平台,为中国制造业赋能。
据张云泉透露,在“神威”E级超算原型机正式启用的近1个月中,济南超算中心已经将“神威·太湖之光”的20多个应用顺利移植过来,并进行了一系列测试。
张云泉还向《环球时报》记者介绍,“神威”E级原型计算机也紧跟行业热点,首次在国产超级计算机上构建了人工智能软件生态链,基于神威深度学习库和框架,开展了对弈系统、医疗影像识别、机器翻译多个大规模人工智能应用,其中机器翻译应用的数据规模、并行规模和训练速度世界领先。(赵觉珵)
超算不仅要速度,还要好用
视觉中国
为了保持在超级计算机研发领域的竞争力,欧盟近日宣布,将投入10亿欧元用于研制两套世界级超级计算机系统,并期望最终超越中国、美国和日本。
虽然超级计算机的基本组件与个人电脑没有太大差异,但作为计算机中功能最强、运算速度最快、存储容量最大的一类计算机,超级计算机一直被视为“国之重器”,是世界各国竞相角逐的科技制高点,也是一个国家科技实力的重要标志。
运算速度与拥有量 双双领先
谈及超级计算机,可能大家都会觉得离日常生活比较远,其实不然。“超级计算作为一项具有战略意义的技术,它的应用已不局限于基础科学研究,它正在国家安全等领域发挥着重要作用。实际上,我们生活的方方面面都与超级计算机有着密切的联系。”清华大学教授、国家超级计算无锡中心主任杨广文告诉科技日报记者。
在石油勘探、高端装备制造、生物医药、动漫设计等领域,超级计算机都有广阔的应用前景。比如,借助超级计算机的模拟手段,科学家可在较短的时间内从几十万甚至几百万种化合物中筛选出有效的药物化合物,这不仅节省了购买真实化合物的大量资金,而且大大缩短了药物研发的周期。
在最新公布的世界超级计算机TOP500榜单中,我国的“神威·太湖之光”超级计算机以每秒12.5亿亿次的峰值计算能力以及每秒9.3亿亿次的持续计算能力,夺得冠军。它1分钟的运算能力相当于72亿地球人同时用计算器不间断计算32年。
“目前,我国是唯一一个超级计算机的计算能力超10亿亿次/秒的国家,其他国家超级计算机的运算速度约在几亿亿次/秒,大概两三亿亿次这样的一个水平,今年美国可能会推出运算速度20亿亿次/秒左右的超级计算机。”清华大学副教授、国家超级计算无锡中心副主任付昊桓对科技日报记者说。
我国不仅在超级计算机的计算性能上做到了国际领先,而且在超级计算机的拥有量上也名列前茅。在新一期世界超级计算机500强名单中,我国占了202个,美国占143个。
上千万人一起干活 协同调度难
此番欧盟要想扭转颓势,研制世界最快的超级计算机,还需要扫清不少技术上的“拦路虎”。
比如,我国的“神威·太湖之光”就安装了40960个中国自主研发的“申威26010”众核处理器,同时一个处理器里面有260个核,总共有1000多万个核。
在杨广文看来,如何统一调度上千万个核,并令应用程序能将计算任务有效分配到这些核上,这是超级计算机研发领域关注的焦点问题。“1000多万个核去解决一个问题,就相当于一个人指挥上千万人去干活,如果不能科学管理,就很难实现每个人工作效率的最大化。超级计算机也一样,处理器核心统一调度的技术难度也是多方面的。”杨广文说。
杨广文表示,首先是芯片技术,要确定什么样的芯片最合适;二是芯片的互联技术,这么多的芯片,用什么方法联起来最高效;三是功耗,要尽量降低功耗;四是管理技术,这么多芯片该如何管理,怎样才能及时发现问题;最后硬件完成以后,还得有应用程序,这样就形成了一个超算的生态,使用中需要不断完善、不断更新。所以,要想研制全球最快的超级计算机,需要全方位的技术突破。
付昊桓还表示,虽然近几年因为经费问题,欧盟有关超级计算机的研发相对滞后,但其实欧盟在超级计算机的研发方面已有相应的技术积累,比如芯片研发、系统制造。
超级计算机的下一步 打赢应用之战
与此同时,欧盟提出研制最快超级计算机也引发了网友关于未来的超级计算机将会朝着什么方向发展的讨论。
“实际上,现在大家都在探索下一代超级计算机的发展方向,但到目前为止还没有定论。无论在结构上还是在采用的技术方案上都没有明确的说法,大家还在不断研究,各国都在摸索。”杨广文说。
付昊桓表示,下一代的超级计算机,虽然速度上肯定还会提升,但在应用的层面上会有变化。传统的高性能计算机更多地用于模拟工作,但最近几年有关大数据的应用越来越多,未来的超级计算机可能会比较注重计算与大数据的融合。
国际超算界已把超级计算机的下一个速度峰值锁定为E级即百亿亿次/秒。国家“863计划高性能计算机及其核心软件”重大专项总体组组长、中山大学钱德沛教授曾表示:“从速度上说,百亿亿次相当于现在最快计算机的10倍;在计算密度、通信速率、功率能耗等方面,更是提升了一个数量级。”当前,百亿亿次计算机已成为世界各国激烈争夺的“制高点”。同时,杨广文也表示,在下一代超算的竞争中,中国不仅要打赢速度之战,更要打赢应用之战。
长久以来,应用被认为是我国超算发展的主要短板。
但在杨广文看来,事情已经有了变化。他表示,到目前为止,“神威·太湖之光”已完成应用17项,在天气气候、航空航天、海洋科学等重要领域取得了一些应用成果。最近几年,我国已在超算的应用上取得了长足的进步,也受到了国外相关研究人员的高度关注。
相关问答
常听说十 核 处理器“一核有难,九核围观”,十核处理器真的只是噱头吗?不能片面的说手机处理器较多的核心数量没用,只是很多情况下根本用不到。就拿PC上的多核处理器来说,四核处理器已经推出了十多年之久,但是仍然有大量的应用程...
华为鲲鹏920的诞生,在未来会对中国超算有什么积极影响吗?5G,人工智能,物联网,这些曾经只存在电影里的技术正逐渐走入普通人的生活,消费者对电子产品的配置也越发挑剔。与移动市场的广泛关注形成鲜明对比的是,普通用...
太湖之光有多大?太湖之光的设计初衷是为了满足我国大型科学计算和精密数据处理的需求,它采用了国产众核芯片申威26010,拥有40960个计算节点,运算速度高达每秒9.3亿亿次,...
众 财科技车贷靠谱吗?众财车贷进入网贷行业已有7年多时间,他们从初期的稚嫩、探索到现在的成熟、创新,如今已经稳居车贷行业龙头。他们深耕车贷7年,在专注垂直领域的同时,一直探寻...
GPU为什么没有分支预测能力 - 董懂艳dAn 的回答 - 懂得首先需要解释CPU(CentralProcessingUnit)和GPU(GraphicsProcessingUnit)这两个缩写分别代表什么。CPU即中央处理器,GPU即图形处理器。其次,要解释两....
【什么是有机体?为什么说细胞是一个有机体?有机体的概念是什...[回答]因为细胞有生命的,能实现全部生命活动的生物个体,符合定义;至于有机体的概念很多层啊--------(以下选自百科)定义1:目前,在心理学界较为流行的定...
脑血管堵塞掉头发_千问健康脑血管堵塞掉头发_千问健康
石和可这两个字的部首和结构分别是什么,石是独体字还是半包围...[回答]石,部首:石,部外笔画:0,总笔画:5.汉字结构:独体结构.可,部首:口,部外笔画:2,总笔画:5.汉字结构:半包围结构(左下开口).石,部首:石,部外笔画:0,总笔...
涉众 型经济犯罪案件罪名主要有什么?_法律问答—华律网[回答](二)走私罪1、走私武器、弹药罪;2、走私核材料罪;3、走私假币罪;4、走私文物罪;5、走私贵重金属罪;6、走私珍贵动物、珍贵动物制品罪;7、走私珍稀植...
众安 保险的投资方是哪家- 汇财吧专业问答[回答]众安保险的三马背景都在互联网或保险领域有丰富的经验和大数据,众安也是国内首个拿到互联网保险牌照的公司,这都说明了众安保险跟互联网属性分不开...