挑战神威太湖之光,日本超级电脑有什么独到之处?
在中国神威太湖之光率先将性能冲到 100P 后,日本也按捺不住了,日本富士通发布了要建 1000P 超级电脑的 PPT,而且还引 ARM 为外援。也许有人会问,能成吗?
其实,日本在超级电脑上的技术实力并不差,而且还曾经有过京这样曾经雄踞 TOP500 榜首的大机器,虽然在 TOP500 上被后来者超越,但在 Graph500 上依旧雄踞榜首。只是日本经济持续低迷和时运不济,日本超算逐步被中国和美国拉出了距离。
日本超算京才是世界第一?
就在神威太湖之光在 TOP500 荣登榜首之际,日本经济新闻报导,“神威太湖之光虽然排名比较靠前,但其适合的领域有限,对于用户而言是比较难用的机器”,日本很多相关人士表示,“超级电脑要有用才行”。
日本东京工业大学教授松冈聪说:“京与神威背后的设计思想有很大的不同,京是透过扩充大量内存,可广泛应对各种现实运算的超级电脑。在 500 强中速度虽然仅为神威的九分之一,但京即使面对复杂的运算也不容易减速。神威虽然排名比较前面,但被认为其适合的领域有限。”
松冈表示神威对于用户而言是比较难用的机器,这点不可否认。
为此,笔者咨询了业内专家,他认为松冈说的有一定道理,并表态:
“客观地说,如果我自己出钱买的话,我选择京。”
也有业内专家表示:
“毕竟异构众核是大趋势……从计算性能上看,神威太湖之光依然是世界第一。”
京有什么独到之处?
虽然京在 Linpack 性能上大约是神威太湖之光的九分之一,尽管日本目前并没有建设出能与天河 2 号、神威太湖之光相匹敌的超级电脑,但就京本身而言,还是有其独到之处的。
2016 年 7 月,在 Graph500 排行榜上,京连续第三次夺得冠军──
在测试中京用 0.45 秒时间成功解开了由大约 1 万亿个根节点及 16 万亿个分支节点组成的大规模图表广度优先搜索问题。基准测试得分为 38621GTEPS。排名第二的是中国的神威太湖之光,成绩为 23756GTEPS;排名第三的是美国的红杉,为 23751GTEPS,排名第四的是美国米拉,14982GTEPS。什么是 Graph500 呢?其实,除了强调 Linpack 性能的 TOP500,还有强调内存频宽和延迟的 Graph500,和强调节能环保的 Green500。
Graph500 对全系统的内存频宽和内存延迟有很高的要求,而计算能力本身已经不影响测试结果了,这种测试偏向于访存密集型运算,在大数据分析以及大规模图表分析等场景下比较有意义。
近年来,有观点认为 Linpack 测试已经过时了,TOP500 创始人之一的田纳西大学教授 Jack Dongarra 就提出了 HPCG 测试,与 Linpack 关注线性方程的计算性能不同,HPCG 更加看中整体性能的平衡,能代表了共轭梯度迭代法的一类应用的计算和通讯特征,但也仅仅代表了某一个方面的特征,并不能涵盖超级电脑的特征。如果计算性能和通讯不是一个量级的,即便两项指标分开看都很强,但也会导致 HPCG 偏低的结果。截至目前,HPCG 还没有被业界广泛接受。
在 HPCG 测试中,京的表现也不错,仅次于天河 2 号,成绩为 554.4TFLOPS,天河 2 号的成绩为 580TLFOPS,名列第三的神威太湖之光 HPCG 性能是 371.2TFLOPS。如果用代表运算实际效率的 HPCG/HPL 这项指标看,天河 2 号的 HPCG/HPL 参数为 1.1%,神威太湖之光的 HPCG/HPL 参数为 0.4%,而京的 HPCG/HPL 参数为 4.9% 。HPCG 更看重综合性能,要求计算性能、内存频宽、延迟等指标兼顾,一旦出现某项性能特别强的情况,也就是出现偏科的情况,即便几项指标都不差,也会出现 HPCG 运算速度偏低的情况。
计算和通讯的不平衡导致 HPCG/HPL 偏低
神威太湖之光 HPCG/HPL 偏低的原因,就在于计算性能和通讯等要素之间的不平衡程度较高──神威太湖之光之所以能在 TOP500 排名第一、Green500 排名第三、在 Linpack 浮点性能 93PFLOPS、Linpack 效率高达 74.16% 的情况下,性能功耗比达到 6G/W,做到了兼顾计算性能和节能环保,而且这还是在处理器的制程落后 Intel 两代,采用 28nm 制程的情况下做到的,原因就在于借助大量处理器并行来提高运算速度,同时透过降低耗电极大的储存器性能来削减能耗,这会加重综合性能上的不平衡──这种不平衡并非是计算性能差,或者网络差──在计算性能上神威太湖之光是顶级的,在网络方面,神威太湖之光只是主流水平,还称不上顶级的网络正是因为计算和通讯上的不平衡,导致神威太湖之光 HPCG/HPL 参数偏低。
而京在这项参数上之所以高,就是因为虽然在计算性能和通讯并非顶级水平,但因为计算性能和通讯属于一个量级,加上属于同构超级电脑的因素,所以 HPCG/HPL 参数会比较高。
这两个测试的意义在于说明了京的易用性较好,而且透过扩充大量内存,可广泛应对各种现实运算,具有较广的应用面,而且在计算性能和通讯上做的非常均衡。相比之下,神威太湖之光就属于各方面性能都不错,但计算性能特别强悍的类型,在均衡性上是不如京的。但这并不意味着神威太湖之光就不如一台几年前的大机器,实际上,在绝对性能和在神威太湖之光所擅长的应用上,京是无法企及的。
日本下一代超级电脑会是什么样?
在德国法兰克福举办的国际超级电脑大会上,日本富士通公司透露它的下一代超级电脑 Post-K 将使用 ARMv8 架构,根据富士通公布的计划 Post-K 计划在 2020 年推出,计划应用性能是 K 的 100 倍,也就是性能将达到 1000 PFLOPS,换言之就是神威太湖之光性能的 10 倍。
另外,富士通还公布了可以用于建设 100P 超级电脑的技术储备──SPARC64 XIfx 处理器,该款处理器有 32 个核心用于计算,2 核心用于运行 OS 服务,有点类似于 BlueGene/Q,采用 20nm 制程,双精浮点性能超过 1TFlops。至于日本能不能将技术图纸变成现实,只能有时间来检验了。
(本文由 雷锋网 授权转载;首图来源:By Haruhiko Okumura from Tsu, Japan (京の全貌) [CC BY 2.0], via Wikimedia Commons)
延伸阅读:
- 日本将打造世界最快超级电脑
如需获取更多资讯,请关注微信公众账号:半导体行业观察
- 半导体行业观察
- 摩尔芯闻