全球最快超算出炉，从CPU到GPU，英特尔包圆

发布者：知足者常乐 2023-6-27 01:26

E级，也就是10^18/s的计算力，是“主流”超算领域时常被挂在嘴边的目标方向。而对倾国之力打造的国之重器，全球最快超算速度已接近2E。

气象、能源、核爆、生物、人工智能，对计算力的需求几乎是无限的，在光子、量子计算提供越级性能提升之前，电子还将是主流。这不，依托代号为代号Sapphire Rapids HBM（高带宽内存）的英特尔至强CPU Max系列CPU和代号为Ponte Vecchio的英特尔Xe HPC架构GPU——同样集成HBM，部署于美国能源部阿贡国家实验室的超级计算机Aurora（极光），正式宣布实现200E性能，是目前TOP500超算冠军Frontier的2倍。

Aurora超算由CRAY打造，共有10624个节点（刀片服务器），每个节点2组CPU及6组GPU，即21248颗CPU、63744颗GPU，总计提供1.36PB的HBM CPU内存（带宽30.5PB/s）和8.16PB（带宽208.9PB/s）的HBM GPU内存，再加上10.9PB的DDR5内存（带宽5.95PB/s），系统共有近20PB内存；存储系统采用了1024个全NAND闪存阵列，总容量达到了230PB，速度为31TB/s；而占地面积达到2个篮球场大小。

此前基于AMD EPYC CPU的超算凭借更多节点和更强I/O，拿下了多次超算冠军，甚至使用了AMD CPU+AI计算器的Frontier，成为首款速度突破100E的超算。Aurora的诞生，可是让英特尔出了口恶气，不仅CPU，GPU也是。

更有甚者，基于Aurora，英特尔还打造了Aurora genAI模型，参数量高达1万亿，也就是时下火爆的GPT 3/3.5 1750亿参数的5倍以上，而且其面向领域主要为科学计算领域，和ChatGPT以文字为主的生成式AI有着极大差别。

Aurora的成功，不仅证明了英特尔自身CPU及GPU架构/产品在超算领域中的实力，也证明了x86架构在AI领域中的应用价值。

无论是英特尔还是AMD，x86架构超算持续突破计算峰值，给中国超算发展提供了很好的思路。目前国内性能最高的超算仍是神威·太湖之光，其首次登顶TOP500已是2016年此时之事。此后，随着中美之间科技竞争的白热化，ARM CPU架构和GPGPU都遇到了发展瓶颈，简单累加核心方式的边际效益几乎归零，光量子计算势必成为突破的关键。

中央处理器 GPU 英特尔 Aurora 人工智能 X86

上一篇：盘点20种世界上最快的东西，看完涨知识了！

下一篇：欧洲成全球变暖速度最快大陆