最近,TOP500超级计算机排名最新出炉。日本超算Fugaku首次搭载ARM芯片夺冠!
目前,世界十大超级计算机中有八台使用 NVIDIA GPU、 InfiniBand 网络或两者都有使用。这些超级计算机是美国、欧洲和中国最强大的计算系统。
按国家划分,中国持续占据500强的主导地位,共有226台超级计算机上榜。美国排名第二,有114套超算上榜。
日本排名第三,有30套系统;法国有18套系统;德国有16套系统。美国在数量方面排名第二,但总体运算速度仍然超过中国,为每秒644千兆次浮点运算,中国为每秒565千兆次浮点运算。日本的系统可以提供530千兆次的浮点运算。
英伟达GPU占据TOP500超级计算机三分之二,能耗大幅降低
英伟达目前已与 Mellanox 合并,在最新榜单上占据了 TOP500 系统总数的三分之二(333) 。在 TOP500排名前25的超级计算机中,有20台使用了 NVIDIA GPU。英伟达Selene美国最快的工业系统,绿色500检测排名第二。Nvidia Selene 系统以领先的能源效率成为美国最快的工业系统!在能源效率方面,使用 NVIDIA GPU的系统脱颖而出。与没有搭载 NVIDIA GPU(以千兆次浮点运算 / 瓦特为单位)的系统相比,能源效率平均提高了2.8倍。
这种能源效率的最好例子是 Selene系统,它是 NVIDIA 内部研究集群的最新成员。该系统在最新的 Green500名单上(能源效率排名)排名第二,在 Linpack 基准测试中以27.5 petaflops在TOP500榜单中排名第七。Selene的功耗为20.5 gigaflops/watt,与Green500榜单上的第一名相差甚微,但排名第一的系统体积更小,其性能表现仅排在第394位。Selene 是唯一一个突破20gigaflops/watt 大关的100强系统。它也是世界上第二强大的工业超级计算机,仅次于意大利能源巨头埃尼集团公司的第6号系统,该系统也使用 NVIDIA GPU。Nvidia GPU正在为TOP500超级计算机提高能源效率。在节能方面,Selene 的效率是没有使用 NVIDIA GPU的 TOP500 系统的6.8倍。Selene 的性能和能源效率得益于 NVIDIA A100 GPU的第三代张量核,它加快了传统64位模拟的速度,降低了 AI 的精度。
Selene系统仅仅花了不到四周就建立起来了。因为工程师使用 NVIDIA 的模块化参考架构。便能够快速组装 Selene。
此前在英伟达GTC 2020上发布的DGX A100是一个敏捷的系统,它在一个 6U 服务器上安装了8个 A100 GPU 和 NVIDIA Mellanox HDR InfiniBand 网络。它的创建是为了加速高性能计算、数据分析和人工智能工作(包括培训和推理)的组合,并能快速部署。苹果在WWDC发布会上正式宣布将在Mac电脑上采用ARM SoC芯片。无独有偶,在最新的TOP500超算排名中,使用48核ARM芯片的日本Fugaku超算位列世界第一。曾在2011年的时候,日本凭借K超级计算机拿下了TOP500冠军,是世界上第一台每秒执行10万亿次运算的超级计算机,使用的是日本富士通研发的SPARC64处理器。去年,K超算退役。Fugaku超算由日本理化研究所联合富士通打造,此前的代号叫Post-K,也就是京超算后一代的意思,最终以富士山的名字正式命名为Fugaku。Fugaku超算最大的变化就是CPU采用了ARM架构,峰值浮点性能高达513PFLOPS(51.3亿亿次),Rmax性能为415.5PFLOPS(PFLOPS指的是每秒1千万亿次浮点运算),是第二名超算Summit的2.8倍,不过功耗也达到了28MW,是Summit的2.8倍。值得注意的是这台超级计算机竟然是基于ARM架构的,这也是 TOP500 排行榜里首个采用ARM芯片的超级计算机。从传统观念来看,ARM是移动芯片,性能比较低。目前,多数超级计算机仍然采用的是英特尔和AMD的芯片组。与现有超算相比,这代超算最大的变化就是采用ARM架构,由富士通的48核A64FX SoC提供支持。Fugaku超算的浮点部分是与ARM合作的SVE指令扩展,使用了512bit浮点运算单元,每个节点使用48核+4辅助核,IO及计算节点则是48核+4辅助核结构。性能最好的Fugaku 超级计算机在此次Green500上排名第九,每瓦能进行14.67 gigaflops 运算。它的功率效率仅次于Summit的14.72 gigaflops/watt。而目前Fugaku超算的性能还不是完整版,后续还会继续升级到1000PFLOPS,也就是百亿亿次,最终要在2021年左右投入使用。据理化研究所称,除了运算速度,Fugaku在其他三个部门也是第一,成为全球首个获得「四项冠军」。其他三个部门是产业方面利用较多的计算手法性能,用于AI领域的计算性能,以及成为大数据解析指标的解析性能。中国超算总数实力霸榜,联想继续蝉联全球最强超算供应商Top500排行榜目前依然是由中国和美国的超级计算机主导 , 美国开发的另一台超级计算机Sierra排名第三,而中国的「神威·太湖之光」和「天河2A」分别排在第四和第五位。中国长期以来在超算领域保持优势,对美国政府和研究机构触动很大,也促使美国加大投入研发新一代超级计算机。有专家曾介绍说,无论是的国防、材料科学、天文学,还是距离我们生活更近的天气预报、灾害监测、交通管理,超算都大有用武之地。在最近抗击新冠疫情的过程中,各国超算也都倾尽全力。中国「天河二号」超算协助搭建起「15秒断诊」的新冠CT影像智能诊断平台,并助力筛选能抑制病毒的小分子药物。美国Summit超算同样参与到新药研制中,模拟新冠病毒与不同化合物的反应。此次夺冠的日本Fugaku超算也为探索新药启动了试验。由中国国家并行计算机工程技术研究中心(NRCPC)开发的「神威·太湖之光」排名第四。该系统完全由 Sunway 260核 SW26010处理器提供动力。2016年6月在中国无锡国家超级计算机中心安装,HPL性能为93 petaflops。由中国国防科技大学开发的「天河2A」排名第五。它是采用 Intel 至强 CPU 和定制的 Matrix-2000协处理器的混合架构,HPL性能为61.4petaflop,目前部署在中国广州的国家超级计算机中心。在全球浮点运算性能TOP500超算中,联想有180台超级计算机入围榜单,较上份榜单的173台增加7台,数量远超其他厂商,再次名列全球高性能超算供应商的第一名。另外,曙光68台,浪潮64台,中国制造商合计占312台。