全球最快超算出炉,从CPU到GPU,英特尔包圆

发布者:知足者常乐 2023-6-27 01:26

E级,也就是10^18/s的计算力,是“主流”超算领域时常被挂在嘴边的目标方向。而对倾国之力打造的国之重器,全球最快超算速度已接近2E。

气象、能源、核爆、生物、人工智能,对计算力的需求几乎是无限的,在光子、量子计算提供越级性能提升之前,电子还将是主流。这不,依托代号为代号Sapphire Rapids HBM(高带宽内存)的英特尔至强CPU Max系列CPU和代号为Ponte Vecchio的英特尔Xe HPC架构GPU——同样集成HBM,部署于美国能源部阿贡国家实验室的超级计算机Aurora(极光),正式宣布实现200E性能,是目前TOP500超算冠军Frontier的2倍。

Aurora超算由CRAY打造,共有10624个节点(刀片服务器),每个节点2组CPU及6组GPU,即21248颗CPU、63744颗GPU,总计提供1.36PB的HBM CPU内存(带宽30.5PB/s)和8.16PB(带宽208.9PB/s)的HBM GPU内存,再加上10.9PB的DDR5内存(带宽5.95PB/s),系统共有近20PB内存;存储系统采用了1024个全NAND闪存阵列,总容量达到了230PB,速度为31TB/s;而占地面积达到2个篮球场大小。

此前基于AMD EPYC CPU的超算凭借更多节点和更强I/O,拿下了多次超算冠军,甚至使用了AMD CPU+AI计算器的Frontier,成为首款速度突破100E的超算。Aurora的诞生,可是让英特尔出了口恶气,不仅CPU,GPU也是。

更有甚者,基于Aurora,英特尔还打造了Aurora genAI模型,参数量高达1万亿,也就是时下火爆的GPT 3/3.5 1750亿参数的5倍以上,而且其面向领域主要为科学计算领域,和ChatGPT以文字为主的生成式AI有着极大差别。

Aurora的成功,不仅证明了英特尔自身CPU及GPU架构/产品在超算领域中的实力,也证明了x86架构在AI领域中的应用价值。

无论是英特尔还是AMD,x86架构超算持续突破计算峰值,给中国超算发展提供了很好的思路。目前国内性能最高的超算仍是神威·太湖之光,其首次登顶TOP500已是2016年此时之事。此后,随着中美之间科技竞争的白热化,ARM CPU架构和GPGPU都遇到了发展瓶颈,简单累加核心方式的边际效益几乎归零,光量子计算势必成为突破的关键。

大家都在看

返回顶部