大模型的基础设施如何建先要搭千卡万卡规模的网络架构
生成式人工智能(AI)作为一项划时代的技术,经历了巨大的变革和发展。百度杰出系统架构师王雁鹏在深圳的文心大模型技术交流会上表示,生成式AI最显著的特点是模型规模巨大,过去几年以每年10倍的速度增长。生成式AI的智能计算基础设施是一个庞大而复杂的系统,需要从网络架构、存储、加速层、框架和容错等多个方面进行设计和优化。通过这些努力,可以为大规模的生成式AI应用提供稳定、高效且易用的计算基础设施。以往的AI应用中,许多训练任务都可以在单卡或单机上完成,但在大模型时代,完成一个任务需要使用上千甚至上万张显卡。王雁鹏认为,在如此巨大的计算能力需求下,智能计算基础设施的设计范式发生了转变。

一、要构建万卡规模的大模型基础设施,有四个关键点需要关注:
1.需要构建智能计算集群,能够支持高速互联并具备各种异构算力,如中央处理器(CPU)和图形处理器(GPU)等。这需要保证高效的卡间通信。
2.仅有强大的硬件能力并不足以取得良好效果。优化软件堆栈非常重要,优化的结果将体现在训练和推理性能上的加速。
3.高性价比是一个重要考虑因素。构建这样的系统需要合理的技术选择,不一定选择最昂贵的解决方案。合理分层存储和计算,并追求更高的性价比。
4.易用性是前所未有的挑战。在万卡规模下,稳定运行、弹性容错以及一站式应用的易用平台都是重要问题。

百度智能云副总裁朱勇透露,自百度的文心一言技术在3月16日开始内测以来,通过算法和模型的持续优化,其在企业服务中高频场景下的推理性能已经提升了50倍。为了实现这一结果,王雁鹏从技术角度解释了过去一个月的工作和新的技术范式转变。王雁鹏指出,生成式AI是一项跨越式的技术,和以前的技术有了巨大的变革。其最显著的特点是模型规模庞大,每年以10倍的速度增长。之前的AI应用中,许多训练任务可以在单卡或单机上完成,但在大模型时代,需要上千张或上万张卡来完成一个任务。
增加模型规模并不能很好地提升模型的效果和性能,还需要相应地增加数据量级。大模型的数据量级是指数级增长的,这类似于摩尔定律。以前摩尔定律需要每年翻一番,现在大模型的"摩尔定律"更快,大约每8到10个月翻一番。与原来的摩尔定律不同的是,大模型不仅需要芯片的能力,还需要整个芯片、框架和系统的全栈优化。在这种巨大的算力需求下,智能计算基础设施的设计发生了变革。
二、构建万卡规模的网络架构
在如此大规模下,保证网络的扩展性和避免拥塞是非常困难的。大模型的通信特点是有很多集合通信的操作,这可以分解成同号卡之间的集合通信。为了解决这个问题,需要优化网络架构,在同号卡之间建立高速通信通道,以提高整体网络的吞吐量并消除拥塞和冲突的可能性。
除了计算方面,存储也是另一个关键问题。需要具备大容量和高速度,因此设计了多级存储系统。大量数据存储在对象存储系统中,高速训练时需要充当缓存系统的角色。
三、加速层对于AI训练来说,计算过程非常复杂,包括IO预处理、IO读取、各种算子的高性能实现和优化,以及通信的优化和显存利用率。需要在训练加速套件中整合整个软件栈。对于推理加速套件来说更加重要。推理过程对大模型来说是一个巨大的挑战。通过集中攻关和软件优化,百度在文心一言发布后的一个月时间内,使推理性能提高了50倍。
大家都在看
-
宇宙的奥秘探索:我们到底走了多远? 朋友们,你有没有想过,浩瀚的宇宙到底藏着什么秘密?从小仰望星空,看到那一颗颗闪烁的星星,心里是不是也会想:它们背后到底隐藏着什么?其实,关于宇宙的故事,就像一场永不停歇的冒险,充满了奇迹和谜题。今天就 ... 宇宙探索12-07
-
精妙绝伦的宇宙探索未解之谜 6个精妙绝伦的宇宙未解之谜,颠覆认知的星际谜题至今无解!宇宙浩瀚如穹顶,藏着无数超越想象的奥秘。从神秘的暗物质到诡异的黑洞奇点,从外星文明的猜想 to 宇宙的终极命运,这些未解之谜既牵动着科学家的探索神经 ... 宇宙探索12-03
-
用我们能读得懂的语言走进宇宙前沿知识——引力的了解和探索之中 在人类探索宇宙的漫长历史中,我们逐渐掌握了更多宇宙的秘密,宇宙的运行规则最终被归结为四种力,它们都非常神秘,难以理解,是宇宙探索的最前沿理论。而它们之中,引力与我们最为接近,也最容易被我们理解。它既是 ... 宇宙探索12-02
-
【标题】天文与宇宙探索带你走进神秘的星空世界,揭开宇宙的秘密 嘿,朋友们!你有没有想过,天上的那些星星到底藏着什么秘密?为什么我们能看到那么多星座?人类又是怎么一步步走进浩瀚宇宙的?今天就带你深入了解一下天文和宇宙探索的那些事,让你对星空有更酷、更震撼的认识!说 ... 宇宙探索12-02
-
70年后人类如何探索宇宙?中国科技馆“筑梦星球”展提供科幻答案 中新网北京12月1日电 (记者 孙自法)70年之后,人类会取得哪些重大科技突破?人们将如何进一步探索和利用宇宙空间?……中国科技馆最新推出的“筑梦星球”科幻主题展览,为这些问题准备了答案。最新推出的“筑梦星球 ... 宇宙探索12-02
-
从1912到2025,宇宙射线起源探索终突破,中国观测站功不可没 本文内容均是根据权威材料,结合个人观点撰写的原创内容,辛苦各位看官支持。2025年11月,四川稻城亚丁海拔4410米的高原上,LHAASO观测站的探测器突然记录到一串异常数据。这个由数千个闪烁体和水切伦科夫探测器组成 ... 宇宙探索11-30
-
无限与樊笼:论宇宙探索中的人类认知边界 文/星火燎原 在浩渺无垠的宇宙长河中,我们所在的银河系,是一个拥有数千亿颗恒星、横跨十万光年的宏伟天体系统。在其旋臂之上,我们的太阳、我们的地球,不过是这亿万分之一的微光。在人类有限的感知中,银河系的尺 ... 宇宙探索11-29
-
地球存在如此多威胁人类的问题,为什么还要投资探索宇宙呢? 当森林大火吞噬加州社区、气候变化威胁全球稳定、流行病挑战公共卫生体系时,质疑天文学研究价值的声音显得合情合理。毕竟,在2025年1月的加州山火中,损失超过2500亿美元,而美国林务局的年度预算却不足100亿美元。在这 ... 宇宙探索11-29
-
中国航天再破局!卫星天团探索宇宙,千年谜题即将揭晓 哈喽大家好,今天小无带大家聊聊最近全网沸腾的航天大动作!2025年11月24日下午,北京怀柔科学城一场发布会直接把全网炸翻了!没有流量明星,没有花边新闻,就靠一个十五五太空探源科学卫星计划,网友们的留言直接刷 ... 宇宙探索11-28
-
中国“太空天团”将出征!四颗卫星开启宇宙终极探索之旅 当你仰望星空,是否好奇宇宙如何诞生、地球是否孤独、黑洞真面目究竟是什么?我国“十五五”期间(2026-2030)将发射四颗卫星,直击这些人类的终极疑问。在宇宙探索的征程上,中国正迈出震撼一步。“鸿蒙计划”卫星 ... 宇宙探索11-27
相关文章
- 宇宙有多大:探索无垠星海的奥秘
- 太空科技强国:探索宇宙的未来之路
- 空间站:人类探索宇宙的新前沿
- 利多星智投:从大气层内到宇宙深空的探索——航空航天入门指南
- 实践三十号卫星的成功发谢,为人类探索宇宙奠定了基础
- 探索宇宙的奥秘::从地球到星际的奇幻旅程
- 火星变“地球2.0”要多久?为什么比想象中更难一万倍?
- 人类文明仅1秒,凭什么敢探索138亿年的宇宙?
- 浑天仪:凝聚古人探索宇宙的智慧(字载匠心·惊艳时光的中国智慧)
- 从一束激光到量子奇迹:普通人也能看懂的纠缠实验全解读
- 人类是怎么用望远镜探索宇宙的?背后的原理到底是啥?
- 全国仅十几所!这 5 所天文学强校含金量拉满,探索宇宙就选它们
- 国内天文学三强高校深度解析:A + 学科背后的宇宙探索密码
- 宇宙探索:从火箭到火星的太空旅
- “多维宇宙探索”启幕,2025上海城市空间艺术季浦东分展区点亮张江
- 11部史诗级星际电影:探索宇宙的不同视角你看过几部?
- 探索“多维宇宙”,2025上海城市空间艺术季浦东分展区点亮张江
- 光速飞行未必能逃离银河,人类探索宇宙有多艰难?
- 中微子实验国际合作增进认知 或助力探索宇宙正反物质不对称
- 探索宇宙,亚毫米波不应成为“盲点”
热门阅读
-
预言2030年太阳将休眠,恐怖的千年极寒将来临 07-11
-
中国十大元帅之死,多高寿而善终(林彪叛逃而死) 07-11
-
因果报应真实事例,做尽坏事必遭天谴 07-11
-
全球人口减少可能带来的六大教训和好处 07-18
-
离太阳最近的十大恒星排名,宇宙最大十大星球 04-12
