大模型的基础设施如何建先要搭千卡万卡规模的网络架构
生成式人工智能(AI)作为一项划时代的技术,经历了巨大的变革和发展。百度杰出系统架构师王雁鹏在深圳的文心大模型技术交流会上表示,生成式AI最显著的特点是模型规模巨大,过去几年以每年10倍的速度增长。生成式AI的智能计算基础设施是一个庞大而复杂的系统,需要从网络架构、存储、加速层、框架和容错等多个方面进行设计和优化。通过这些努力,可以为大规模的生成式AI应用提供稳定、高效且易用的计算基础设施。以往的AI应用中,许多训练任务都可以在单卡或单机上完成,但在大模型时代,完成一个任务需要使用上千甚至上万张显卡。王雁鹏认为,在如此巨大的计算能力需求下,智能计算基础设施的设计范式发生了转变。

一、要构建万卡规模的大模型基础设施,有四个关键点需要关注:
1.需要构建智能计算集群,能够支持高速互联并具备各种异构算力,如中央处理器(CPU)和图形处理器(GPU)等。这需要保证高效的卡间通信。
2.仅有强大的硬件能力并不足以取得良好效果。优化软件堆栈非常重要,优化的结果将体现在训练和推理性能上的加速。
3.高性价比是一个重要考虑因素。构建这样的系统需要合理的技术选择,不一定选择最昂贵的解决方案。合理分层存储和计算,并追求更高的性价比。
4.易用性是前所未有的挑战。在万卡规模下,稳定运行、弹性容错以及一站式应用的易用平台都是重要问题。

百度智能云副总裁朱勇透露,自百度的文心一言技术在3月16日开始内测以来,通过算法和模型的持续优化,其在企业服务中高频场景下的推理性能已经提升了50倍。为了实现这一结果,王雁鹏从技术角度解释了过去一个月的工作和新的技术范式转变。王雁鹏指出,生成式AI是一项跨越式的技术,和以前的技术有了巨大的变革。其最显著的特点是模型规模庞大,每年以10倍的速度增长。之前的AI应用中,许多训练任务可以在单卡或单机上完成,但在大模型时代,需要上千张或上万张卡来完成一个任务。
增加模型规模并不能很好地提升模型的效果和性能,还需要相应地增加数据量级。大模型的数据量级是指数级增长的,这类似于摩尔定律。以前摩尔定律需要每年翻一番,现在大模型的"摩尔定律"更快,大约每8到10个月翻一番。与原来的摩尔定律不同的是,大模型不仅需要芯片的能力,还需要整个芯片、框架和系统的全栈优化。在这种巨大的算力需求下,智能计算基础设施的设计发生了变革。
二、构建万卡规模的网络架构
在如此大规模下,保证网络的扩展性和避免拥塞是非常困难的。大模型的通信特点是有很多集合通信的操作,这可以分解成同号卡之间的集合通信。为了解决这个问题,需要优化网络架构,在同号卡之间建立高速通信通道,以提高整体网络的吞吐量并消除拥塞和冲突的可能性。
除了计算方面,存储也是另一个关键问题。需要具备大容量和高速度,因此设计了多级存储系统。大量数据存储在对象存储系统中,高速训练时需要充当缓存系统的角色。
三、加速层对于AI训练来说,计算过程非常复杂,包括IO预处理、IO读取、各种算子的高性能实现和优化,以及通信的优化和显存利用率。需要在训练加速套件中整合整个软件栈。对于推理加速套件来说更加重要。推理过程对大模型来说是一个巨大的挑战。通过集中攻关和软件优化,百度在文心一言发布后的一个月时间内,使推理性能提高了50倍。
大家都在看
-
宇宙探索·星际分子云:恒星诞生工厂与宇宙生命化学的摇篮 宇宙探索·星际分子云:恒星诞生工厂与宇宙生命化学的摇篮星际分子云:宇宙中最壮观的恒星制造工厂在银河系中,最引人注目的景象并非某颗单独的恒星,而是横跨数百光年的巨型分子云(Giant Molecular Clouds, GMCs) ... 宇宙探索06-16
-
宇宙探索·千新星:中子星合并、重元素起源与多信使天文学的黎明 宇宙探索·千新星:中子星合并、重元素起源与多信使天文学的黎明千新星:宇宙中制造黄金的"炼金术熔炉"2017年8月17日,人类天文学迎来了历史性的一天。LIGO-Virgo引力波探测器捕捉到了持续约100秒的引力波信 ... 宇宙探索06-16
-
宇宙探索·磁重联:太阳耀斑与宇宙粒子加速的隐形引擎 宇宙探索·磁重联:太阳耀斑与宇宙粒子加速的隐形引擎磁重联:宇宙中最剧烈的磁能释放机制在太阳表面,每隔一段时间就会爆发一次耀斑——短短几分钟内,相当于数十亿颗原子弹的能量被瞬间释放,喷射出的高能粒子以接 ... 宇宙探索06-16
-
中国宇宙空间站:未来探索的新征程!🚀🌌 别只看热闹发射。很多人以为航天只是上太空拍星星,殊不知中国早已在宇宙铺开一张长远布局,步步为营,落子星河。曾经仰望星空只能羡慕他国的太空设施,载人航天、深空探测,全球卫星网络全都受制于人。早年发射卫星 ... 宇宙探索06-15
-
宇宙探索·重子声波振荡——宇宙声波化石,暗能量探针 宇宙探索·重子声波振荡——宇宙声波化石,暗能量探针✨ 大爆炸后38万年的声波化石,今天仍在宇宙中回响 ✨ 核心科普:重子声波振荡(Baryon Acoustic Oscillations,简称BAO)是宇宙大爆炸后约38万年、宇宙微波背景 ... 宇宙探索06-15
-
探索宇宙的奇妙之旅🚀✨ #未来科技 想象一下几位航天员刚刚打开舱门,迈入那漂浮在太空中的天宫。这一刻不仅仅是他们个人的征程,更是中国空间站建设的关键篇章。神舟二十一号乘组如期完成了进驻任务,向我们展示了中国航天技术的又一次华丽跃升。这支 ... 宇宙探索06-14
-
宇宙探索·蓝色流浪星:球状星团中的恒星身份谜题 宇宙探索·蓝色流浪星:球状星团中的恒星身份谜题在球状星团那密集的恒星海洋中,大多数恒星都遵循着相同的年龄和化学成分——它们几乎是同时诞生的,像一群同龄的兄弟姐妹。但是,天文学家在这些古老的星团中发现了 ... 宇宙探索06-13
-
宇宙探索·红矮星:耀斑活动与系外行星宜居性挑战 宇宙探索·红矮星:耀斑活动与系外行星宜居性挑战在银河系中,红矮星(Red Dwarf,M型主序星)占据了恒星总数的约75%——它们是宇宙中最常见的恒星类型。这些质量仅为太阳的0.08到0.5倍的恒星,表面温度在2,500到4,0 ... 宇宙探索06-13
-
脑科学:探索宇宙中最复杂的物质 如果有人问你,宇宙中最复杂、最神秘的物质结构是什么?答案不是黑洞,不是星系,而是你颅腔中那团约1.4千克、皱巴巴的灰色组织——大脑。它由大约860亿个神经元组成,每个神经元又与数千个其他神经元形成连接,整个 ... 宇宙探索06-12
-
宇宙探秘:从大爆炸到暗物质——人类对浩瀚星空的终极追问 一、序言:我们为何仰望星空?每当夜幕降临,抬头望向满天繁星,你是否曾问过自己:这一切从何而来?宇宙有多大?有没有尽头?在银河系的某个角落,是否也有智慧生命正在凝望着他们的星空,问着同样的问题?从远古洞 ... 宇宙探索06-10
相关文章
- 脑科学:探索宇宙中最复杂的物质
- 宇宙探秘:从大爆炸到暗物质——人类对浩瀚星空的终极追问
- 央视炸裂官宣!南天门计划参数全曝光,中国空天时代呼啸而来
- 宇宙探索·活动星系核喷流——百亿光年外的宇宙超光速灯塔
- 2026最新解析:经典科幻《星际探索》—孤独宇宙中的终极自我探寻
- 2026最新解读:电影《星际探索》—宇宙孤独中的自我救赎深度解析
- 人类探索宇宙的前哨站,NASA公布雄心勃勃的月球基地新计划
- 宇宙探索·银河系以600km/s狂奔,终点在哪里?
- 宇宙探索·暗物质子结构问题—宇宙模拟为何"多了几千个卫星星系"
- 神舟二十三号载人飞船引发两岸热议 国台办:期待台湾同胞同大陆同胞一道探索浩瀚宇宙
- 国台办:期待与台湾同胞一道探索浩瀚宇宙
- 太空驻留200多天!神舟二十一号航天员创造了哪些成就
- 人类探索宇宙的意义到底在哪里
- 宇宙探索·银河系与仙女座星系的未来大碰撞
- 宇宙探索·天鹅座X-1:人类确认的第一个恒星级黑洞
- 宇宙探索·宇宙空洞——宇宙中最寂静、最空旷的巨型区域
- 即将发射悬念拉满!神舟二十三号乘组大猜想,香港航天员或创历史
- 宇宙探索·宇宙再电离——宇宙的"二次黎明"
- 宇宙探索·超新星1987A——中微子天文学的开端
- 今天神舟二十三飞船顺利对接空间站,耗时仅3.5小时!
热门阅读
-
预言2030年太阳将休眠,恐怖的千年极寒将来临 07-11
-
中国十大元帅之死,多高寿而善终(林彪叛逃而死) 07-11
-
因果报应真实事例,做尽坏事必遭天谴 07-11
-
这6个神奇天体有很酷的名字 06-01
-
全球人口减少可能带来的六大教训和好处 07-18
-
离太阳最近的十大恒星排名,宇宙最大十大星球 04-12
-
创生之柱是什么?(创生之柱给予了许多恒星生命) 12-25
精选文章
- 中国51区秘密基地,窃密必被抓(抓住就杀头)
- 中国空间站离地球有多少公里有多大,400公里/大约有110立方米 ...
- 2025年宇宙探索大爆发!月全食、火星冲日等,这些天文奇观别错过
- 黑龙江50万年死火山苏醒, 内含15%电量的巨大岩浆囊
- 中国“天宫”空间站将在2022年前后建成 呈T字型有三个舱段最多可驻留6人 ...
- 中国古代四大凶兽,四大神兽vs四大凶兽谁更强
- 新冠病患康复后,可能“精子减少或无精”
- 误会一辈子!破伤风其实是一种细菌跟生锈铁完全没关系
- 中国长征五号B遥一运载火箭全貌曝光 本月底在海南文昌航天发射场进行首次发射 ...
- 美国同步空间态势感知项目(GSSAP)军事间谍卫星多次秘密靠近俄罗斯和中国的航天器 ...
