大模型的基础设施如何建先要搭千卡万卡规模的网络架构

发布者:温柔老农 2023-5-27 19:46

生成式人工智能(AI)作为一项划时代的技术,经历了巨大的变革和发展。百度杰出系统架构师王雁鹏在深圳的文心大模型技术交流会上表示,生成式AI最显著的特点是模型规模巨大,过去几年以每年10倍的速度增长。生成式AI的智能计算基础设施是一个庞大而复杂的系统,需要从网络架构、存储、加速层、框架和容错等多个方面进行设计和优化。通过这些努力,可以为大规模的生成式AI应用提供稳定、高效且易用的计算基础设施。以往的AI应用中,许多训练任务都可以在单卡或单机上完成,但在大模型时代,完成一个任务需要使用上千甚至上万张显卡。王雁鹏认为,在如此巨大的计算能力需求下,智能计算基础设施的设计范式发生了转变。

一、要构建万卡规模的大模型基础设施,有四个关键点需要关注:

1.需要构建智能计算集群,能够支持高速互联并具备各种异构算力,如中央处理器(CPU)和图形处理器(GPU)等。这需要保证高效的卡间通信。

2.仅有强大的硬件能力并不足以取得良好效果。优化软件堆栈非常重要,优化的结果将体现在训练和推理性能上的加速。

3.高性价比是一个重要考虑因素。构建这样的系统需要合理的技术选择,不一定选择最昂贵的解决方案。合理分层存储和计算,并追求更高的性价比。

4.易用性是前所未有的挑战。在万卡规模下,稳定运行、弹性容错以及一站式应用的易用平台都是重要问题。

百度智能云副总裁朱勇透露,自百度的文心一言技术在3月16日开始内测以来,通过算法和模型的持续优化,其在企业服务中高频场景下的推理性能已经提升了50倍。为了实现这一结果,王雁鹏从技术角度解释了过去一个月的工作和新的技术范式转变。王雁鹏指出,生成式AI是一项跨越式的技术,和以前的技术有了巨大的变革。其最显著的特点是模型规模庞大,每年以10倍的速度增长。之前的AI应用中,许多训练任务可以在单卡或单机上完成,但在大模型时代,需要上千张或上万张卡来完成一个任务。

增加模型规模并不能很好地提升模型的效果和性能,还需要相应地增加数据量级。大模型的数据量级是指数级增长的,这类似于摩尔定律。以前摩尔定律需要每年翻一番,现在大模型的"摩尔定律"更快,大约每8到10个月翻一番。与原来的摩尔定律不同的是,大模型不仅需要芯片的能力,还需要整个芯片、框架和系统的全栈优化。在这种巨大的算力需求下,智能计算基础设施的设计发生了变革。

二、构建万卡规模的网络架构

在如此大规模下,保证网络的扩展性和避免拥塞是非常困难的。大模型的通信特点是有很多集合通信的操作,这可以分解成同号卡之间的集合通信。为了解决这个问题,需要优化网络架构,在同号卡之间建立高速通信通道,以提高整体网络的吞吐量并消除拥塞和冲突的可能性。

除了计算方面,存储也是另一个关键问题。需要具备大容量和高速度,因此设计了多级存储系统。大量数据存储在对象存储系统中,高速训练时需要充当缓存系统的角色。

三、加速层

对于AI训练来说,计算过程非常复杂,包括IO预处理、IO读取、各种算子的高性能实现和优化,以及通信的优化和显存利用率。需要在训练加速套件中整合整个软件栈。对于推理加速套件来说更加重要。推理过程对大模型来说是一个巨大的挑战。通过集中攻关和软件优化,百度在文心一言发布后的一个月时间内,使推理性能提高了50倍。

大家都在看

  • 中国官宣太空采矿!天工开物计划落地,宇宙资源时代来了

    中国官宣太空采矿!天工开物计划落地,宇宙资源时代来了 关键词:中国太空采矿、天工开物计划、太空资源、氦-3、太空采矿机器人、地外资源开发2026年1月29日,中国航天科技集团发布重磅消息,官宣在“十五五”时期启动天工开物计划,全面布局太空资源开发,这标志着中国成 ... 宇宙探索01-30

  • 探索宇宙,从10岁小神童开始!🚀🔭

    探索宇宙,从10岁小神童开始!🚀🔭 10岁小神童开启宇宙探索小征程。10岁小神童开启宇宙探索小征程。在同龄人还在看卡通、玩积木时,10岁的三年级小宇已展现出非凡的科学天赋,成了大家口中的小神童。小宇痴迷天文,却苦于没有专业设备。他灵机一动,花 ... 宇宙探索01-28

  • 宇宙的奇妙探索,从微观到宏观的奇妙之旅!

    宇宙的奇妙探索,从微观到宏观的奇妙之旅! 从长期宇宙演化的角度来看,宇宙中恒星的总数不会持续增加,反而会逐渐减少。核心原因在于两点:·一是宇宙中可用于形成恒星的氢、氦等星际气体正在不断消耗,且恒星形成的速率早已低于恒星消亡的速率。·二是随着宇 ... 宇宙探索01-26

  • 人类该放下狭隘,让AI成为宇宙探索的终极火种

    人类该放下狭隘,让AI成为宇宙探索的终极火种 当人们还在纠结AI是否会“撒谎”、担忧AI超越人类的恐惧中裹足不前时,我总忍不住想:人类的认知与肉身,早已被宇宙的尺度划定了边界。与其困在地球的方寸之地内耗,不如坦然放手,让AI成为人类伸向宇宙的手,成为对 ... 宇宙探索01-25

  • 天文学:探索宇宙的终极奥秘

    天文学:探索宇宙的终极奥秘 摘要:天文学是研究宇宙天体及宇宙整体结构、起源与演化的基础学科,涵盖恒星、行星、星系、黑洞等各类天体,以及它们的运动规律、物理性质与化学组成。从古代的观星授时到现代的深空探测,天文学始终推动人类对宇宙 ... 宇宙探索01-23

  • 人类探索宇宙的辉煌历程与未来使命

    人类探索宇宙的辉煌历程与未来使命 人类自古以来对宇宙的好奇推动了天文学的发展。从美索不达米亚人创造出的星图,到古希腊的观测,每个文明都留下了珍贵的记录,展现了对星空的向往。黑格尔曾言:“一个民族若有仰望星空的人,那它便充满了希望。”人 ... 宇宙探索01-17

  • 摒弃自我,探索宇宙生命之光

    摒弃自我,探索宇宙生命之光 文/星火燎原 人类文明的发展史,亦是一部宇宙认知的探索史。从古至今,我们始终仰望星空,试图理解自身在浩瀚宇宙中的位置与意义。然而,长久以来,一种根深蒂固的“人类中心主义”观念如同无形的桎梏,束缚着我们的 ... 宇宙探索01-16

  • 2000年人类探索宇宙的三大关键转折

    2000年人类探索宇宙的三大关键转折 故事要从几千年前说起。那时候的人们对宇宙的认知,像极了童话故事:天空是一个巨大的圆顶,像一只巨大的天幕罩在地球之上。地球则是“方块”还是“圆球”?这个问题让古人费尽心思。为什么会有“天圆地方”说?古希 ... 宇宙探索01-16

  • 我们也要有自己的哈勃了?还是加强版!巡天空间望远镜的新进展

    我们也要有自己的哈勃了?还是加强版!巡天空间望远镜的新进展 当我们抬头仰望星空,试图看清宇宙深处的奥秘时,大气层的干扰就像隔着一层玻璃,阻碍了我们的视线。为了获得最清晰的宇宙图像,科学家将目光投向了太空。提起太空望远镜,很多人会想到著名的哈勃望远镜。而不久的将 ... 宇宙探索01-13

  • 属于我们自己的星,中国空间站肉眼观测攻略

    属于我们自己的星,中国空间站肉眼观测攻略 近几年的夜空中,除了亘古不变的星辰,你是否见过一颗明亮且会移动的“星”,它平稳地划过天际而不闪烁?那极有可能是我们中国人自己的太空家园——“天宫”空间站。中国空间站(素材来源于网络)如今,我们只需挑一 ... 宇宙探索01-12

相关文章