全球第一的中国超算,自主可控吗?

科技云报道原创。

6月17日,最新一期全球超级计算机500强榜单出炉,中国超算上榜数量蝉联第一。在中美贸易战的大背景下,中国超算能否保持第一的王座,将命脉掌握在自己手中?

在德国法兰克福举行的国际超级计算大会最新榜单上,中国境内有219台超算上榜,上榜数量位列第一,美国以116台位列第二。这是2017年11月以来,中国超算上榜数量连续第四次位居第一。

在此次榜单上,联想、浪潮和中科曙光分别以173台、71台和63台的数量位居全球超算制造商前三位。

美国能源部下属橡树岭国家实验室开发的“顶点”Summit,以每秒14.86亿亿次的浮点运算速度再次登上冠军宝座,超过了它在半年前榜单上的每秒14.35亿亿次的纪录。

美国能源部下属劳伦斯利弗莫尔国家实验室开发的“山脊”Sierra 、中国超算“神威·太湖之光”和“天河二号”分列二三四位,最大浮点性能分别为每秒9.464亿亿次、9.301亿亿次、6.144亿亿次,与之前榜单Top4排名没有变化。

如果把超算TOP 500榜单中的所有超级计算机按国别进行归类,来自中国的超算上榜比例高达41%,来自美国的超算上榜比例是25%,中美两个超级大国统治了全球超过65%的超级计算机。

虽然个体被美国超越,但中国超算的规模仍为全球当之无愧的第一。

那么问题来了,除了规模第一,中国能否超越美国Summit,重夺全球超算性能第一的宝座?

如果美国再次对中国禁售芯片,中国超算还能保持如今的王者地位吗?

今天我们就来聊聊,中国超算自主可控的那些事儿。

中国超算的“绝地反杀”

构建一整套全球顶级的超算系统,并非是单纯的堆砌处理器这么简单,首先要有足够强悍的计算个体芯片、先进的运算管理技术、操作系统的支持,以及足够的财力支持才能够造得出。

当然这一切的背后,最核心的因素是还要有国家层面的政策扶持,以及足够的尖端科技人才储备。所以说,超算是一个国家综合实力的体现一点也不为过。

我国的超算起步比较晚,但是进步神速,这和我国高速发展需求和国家政策支持有着密不可分的关系。

中国的天河二号超级计算机曾经6次蝉联世界超算TOP 500冠军,确立了中国在全球超算中的绝对地位。

但是由于天河二号早期使用的是Intel Xeon的芯片方案,引来了一些质疑和非议。

中国超算的快速崛起也使得美国政府在2015年颁布了引发轰动的“限售”事件:美国政府严禁Intel等公司向中国四家超算中心出口高性能计算芯片。

最近中美贸易摩擦和中兴事件让中国“芯”提升到了国家战略的高度,其实在很多年以前美国就已经对我国的高尖端芯片领域进行“技术封锁”。

2015年美国“限售”事件爆发,中国决定采用国产芯片替代。直至2017年9月份,广州超算中心宣布年底前升级天河二号超算系统,使用国产加速器Matrix-2000取代原本的Intel Xeon Phi加速器。

根据网上资料,Matrix-2000加速器使用的是国产芯片Matrix-2000,由国防科大自主研发设计,但架构、来源一如既往地神秘。

每个加速卡使用了4颗Matrix-2000芯片,每颗Matrix-2000由128个内核组成,频率1.2GHz,每周期能执行16个双精度运算,处理器峰值性能为2.45TFLOPS。

通过国产芯片升级后,天河二号超级计算机取得了算力翻倍的惊人成绩,互联与I/O方面性能指标也获得了较大幅度的技术进步。网络带宽从原来的10Gbps升级到了14Gbps,延迟从1.57us降至1us,内存容量从1.4PB升级到了3.4PB,存储容量从12.4PB升级到了19PB,带宽翻倍到1TB/s,而功耗则从17.8MW降至16.9MW,能效大幅提升。

在美国“禁售”、中国超算白手起家的大背景下,中国超算凭借自主研发的Matrix-2000实现“绝地反杀”。中国目前最强大的超级计算机——神威·太湖之光也是在这样的背景下诞生的。

神威·太湖之光超级计算机安装了40960个中国自主研发的“申威26010”众核处理器。该众核处理器采用64位自主申威指令系统,峰值性能为12.5亿亿次/秒,持续性能为9.3亿亿次/秒。

2016年,国际TOP500组织发布的榜单显示,“神威·太湖之光”超级计算机系统登顶榜单之首,不仅速度比第二名“天河二号”快出近两倍,其效率也提高3倍。

申威26010众核处理器的出现,基本实现了对Intel Xeon Phi加速卡的替代。虽然在单片的性能上仍旧跟Intel Xeon存在性能上的差距,但是得益于体积和功耗上面的优势,可使得一个小小的机箱就可放置256个计算节点,同体积计算性能反杀Intel Xeon Phi。

相比其他国产芯片,申威则要显得更加低调和神秘一些,因为申威处理器自诞生之初就背负着军工国防和国家信息安全的使命,其研发单位总参谋部第五十六研究所(无锡江南计算技术研究所),于2003年开始着手设计中国人自己的高性能芯片。在国家"核高基"重大专项支持下,申威处理采用自主指令集开发,且具有完全自主知识产权。

据最新的消息显示,我国“天河三号”目前正在积极的研发大众,并有望在2020年重新夺回第一宝座,并实现对“神威·太湖之光”高达八倍的性能超越。

更加值得期待的是,“天河三号”有望采用全自主创新设计,自主飞腾CPU、自主天河高速互联通信,以及自主麒麟操作系统。

为什么中国超算领先全球?

大家可能会好奇,国产芯片的制造工艺不如美国,但为什么芯片完全国产的超算“神威太湖之光”,性能却能力压美国超算?

而之前“天河二号”使用的是美国Intel芯片,为什么也能力压美国超算超过6年?

实际上,单个CPU强大并不能决定超算的性能,超算有数万个CPU同时工作,CPU之间的数据通信非常重要。

CPU只是超算芯片的一种最重要的基础芯片,CPU还需要和另外两种非常重要的芯片合作,这就是超算数据网络交换芯片和超算加速及消息处理芯片。中国在超算数据通信网络交换芯片的研发实力上,比美国强大一大截。

中国超算水平在全世界领先,这是无可争议的,但是中国在个人电脑、手机、通信等商用芯片等领域,却反过来被美国吊打,这是为什么呢?超算和普通商用芯片有什么区别?

这就要说到计算的两条发展道路,超算和商用计算是两条基本不相交的道路。

超算是用很多台机器并行运算,不用考虑内部结构等问题,简单来说就是把大量的CPU、 GPU芯片组在一起使用,但芯片和操作系统都需要专门定制。由于超算使用自主的操作系统,完全不用管商用领域的X86、 Windows兼不兼容。

而商用计算的发展道路是,不断改进芯片的制造工艺设计水平,尽量把单个芯片的性能做强大。目前,在个人电子和网络通讯基站方面的高端芯片,中国还远没达到要求。

与此同时,商用领域有各种专利,电脑芯片、手机芯片、操作系统等都被美国企业垄断,中国再想进入商用领域就非常艰难了。

正是考虑到了美国政府的问题,中国在超算刚开始研究时,早在上个世纪就开始布局寻找,如何在计算机芯片领域打破美国的垄断。

1999年,中国买来康柏Alpha处理器授权。Alpha是一个技术上很成功的芯片,但是在商用失败了。单论性能功耗先进程度来说,Alpha比英特尔的X86架构还要好。

之后中国就一直对其研究发展,在发展超算的时候两条腿走路,一边用国外AMD、 英特尔的技术发展超算,一边用Alpha技术发展超算。

在美国对中国禁售芯片之后,中国直接把超算备用选项Alpha上马,并在几年之内研究出了“神威·太湖之光”。

虽然中国费劲波折发展出了自主可控的超算,但是我们必须清醒的意识到,在芯片领域所面临的对手是如此强大,ARM, Intel, AMD, 高通,NVIDIA......任何一个美国芯片公司都具有足够强大的实力。

同时需要特别注意的是,早在5年前,美国政府就已经停止为超级计算机项目的赞助拨款,转而开始大力投资量子计算机的研发工作。这也是此前美国超级计算机止步不前,最终被中国一举超越的重要原因。

未来一二十年,美国超算依然是中国的最大对手,甚至可能每隔一两年,冠军宝座就会在中美之间不断更换主人,毕竟超算是最强大的前沿科技研发的工具。

【科技云报道原创】

微信公众账号:科技云报道