大模型的基础设施如何建先要搭千卡万卡规模的网络架构
生成式人工智能(AI)作为一项划时代的技术,经历了巨大的变革和发展。百度杰出系统架构师王雁鹏在深圳的文心大模型技术交流会上表示,生成式AI最显著的特点是模型规模巨大,过去几年以每年10倍的速度增长。生成式AI的智能计算基础设施是一个庞大而复杂的系统,需要从网络架构、存储、加速层、框架和容错等多个方面进行设计和优化。通过这些努力,可以为大规模的生成式AI应用提供稳定、高效且易用的计算基础设施。以往的AI应用中,许多训练任务都可以在单卡或单机上完成,但在大模型时代,完成一个任务需要使用上千甚至上万张显卡。王雁鹏认为,在如此巨大的计算能力需求下,智能计算基础设施的设计范式发生了转变。

一、要构建万卡规模的大模型基础设施,有四个关键点需要关注:
1.需要构建智能计算集群,能够支持高速互联并具备各种异构算力,如中央处理器(CPU)和图形处理器(GPU)等。这需要保证高效的卡间通信。
2.仅有强大的硬件能力并不足以取得良好效果。优化软件堆栈非常重要,优化的结果将体现在训练和推理性能上的加速。
3.高性价比是一个重要考虑因素。构建这样的系统需要合理的技术选择,不一定选择最昂贵的解决方案。合理分层存储和计算,并追求更高的性价比。
4.易用性是前所未有的挑战。在万卡规模下,稳定运行、弹性容错以及一站式应用的易用平台都是重要问题。

百度智能云副总裁朱勇透露,自百度的文心一言技术在3月16日开始内测以来,通过算法和模型的持续优化,其在企业服务中高频场景下的推理性能已经提升了50倍。为了实现这一结果,王雁鹏从技术角度解释了过去一个月的工作和新的技术范式转变。王雁鹏指出,生成式AI是一项跨越式的技术,和以前的技术有了巨大的变革。其最显著的特点是模型规模庞大,每年以10倍的速度增长。之前的AI应用中,许多训练任务可以在单卡或单机上完成,但在大模型时代,需要上千张或上万张卡来完成一个任务。
增加模型规模并不能很好地提升模型的效果和性能,还需要相应地增加数据量级。大模型的数据量级是指数级增长的,这类似于摩尔定律。以前摩尔定律需要每年翻一番,现在大模型的"摩尔定律"更快,大约每8到10个月翻一番。与原来的摩尔定律不同的是,大模型不仅需要芯片的能力,还需要整个芯片、框架和系统的全栈优化。在这种巨大的算力需求下,智能计算基础设施的设计发生了变革。
二、构建万卡规模的网络架构
在如此大规模下,保证网络的扩展性和避免拥塞是非常困难的。大模型的通信特点是有很多集合通信的操作,这可以分解成同号卡之间的集合通信。为了解决这个问题,需要优化网络架构,在同号卡之间建立高速通信通道,以提高整体网络的吞吐量并消除拥塞和冲突的可能性。
除了计算方面,存储也是另一个关键问题。需要具备大容量和高速度,因此设计了多级存储系统。大量数据存储在对象存储系统中,高速训练时需要充当缓存系统的角色。
三、加速层对于AI训练来说,计算过程非常复杂,包括IO预处理、IO读取、各种算子的高性能实现和优化,以及通信的优化和显存利用率。需要在训练加速套件中整合整个软件栈。对于推理加速套件来说更加重要。推理过程对大模型来说是一个巨大的挑战。通过集中攻关和软件优化,百度在文心一言发布后的一个月时间内,使推理性能提高了50倍。
大家都在看
-
探索宇宙秘境:我国正式启动地外生命探寻工程 探索宇宙秘境:我国正式启动地外生命探寻工程2024年10月,我国发布《国家空间科学中长期发展规划(2024—2050年)》,明确将“地外生命探寻”列为核心任务,正式开启迈向宇宙深处、寻找生命踪迹的科学征程 。这是我 ... 宇宙探索04-30
-
4.2万亿个粒子构建数字虚拟宇宙 “千衍”助力天文探索 今天(23日),中国科学院国家天文台发布宇宙学模拟项目“千衍”。由中国科学家领衔的国际团队成功在超级计算机中构建出一个数字虚拟宇宙,为人类探索宇宙奥秘、研究宇宙的演化历史提供了强大的数字工具。中国科学家 ... 宇宙探索04-25
-
探索宇宙的意义和价值是什么 从科学认知的角度看,宇宙探索正以前所未有的深度,挑战并重塑着人类对自身在宇宙中位置的认知。最具标志性的发现,来自詹姆斯·韦布空间望远镜。它在距离地球124光年的系外行星K2-18b大气中,以99.7% 的统计置信度 ... 宇宙探索04-25
-
抬头!看!中国人探索宇宙的脚步从未停止! 从东方红一号到中国载人飞船系统中国火星探测任务中国载人探月工程……中国人探索宇宙的脚步从未停止!我们曾畅想的,正在由我们书写我们曾仰望的,正在被我们抵达中国航天的每一步都值得我们骄傲!今天是中国航天日 ... 宇宙探索04-25
-
从"太空竞赛"到"精打细算"!冷战之后为何不再疯狂探索宇宙? 导语: 上世纪六七十年代,美苏两国像打了鸡血一样往天上扔火箭,火星、金星、月球被轮番"打卡"。可如今呢?NASA的预算一缩再缩,人类登月计划一拖再拖。太空探索怎么就"熄火"了?一、冷战没了, ... 宇宙探索04-23
-
东西方智慧终极交汇:熵即是阴阳,坤0为首探索宇宙本源 《结构互鉴,文明共生》系列第十二此文为四月系列收官篇,全篇以东西方文明对话为纲,从热力学熵的本源出发,贯通信息、生命、演化、宇宙法则四大维度,把西方现代科学的严密数理,与中华《易经》的阴阳大道熔于一炉 ... 宇宙探索04-23
-
美UFO纪录片导演:当下正处于探索外星文明转折点,“宇宙中人类并不孤单” “真相终将浮出水面,人类并非宇宙中唯一存在的智慧生命。”美国“不明飞行物”(UFO)纪录片《揭秘时代》(The Age of Disclosure)的导演兼制片人丹·法拉赫日前在接受采访时指出,在探索外星生命领域,世界正处于 ... 宇宙探索04-21
-
宇宙探索·中子星:宇宙最极端的天体 宇宙探索中子星:宇宙最极端的天体如果你觉得地球上最坚硬的钻石或者最炽热的熔岩已经算是极端,那么宇宙里有一种天体会让所有地球上的"极端"相形见绌——它就是中子星。一颗质量比太阳更大的恒星,在生命终 ... 宇宙探索04-21
-
男人独自探索宇宙竟碰到了巨大的外星生物 就在半小时前,男人驾驶着飞船降落在这颗冰雪覆盖的星球,放眼看去完全就是一片白雪皑皑,零下两百度的气温更是让他举步维艰。但让他心情澎湃的是,他发现这里氧气非常充足。在确定基本生存条件达标之后,还有更加重 ... 宇宙探索04-17
-
人类探索宇宙的意义何在 从科学家的望远镜,到工程师的实验室,再到国家战略的蓝图,人类探索宇宙的意义,远不止于仰望星空。它是一场由好奇心驱动、被技术赋能、为未来布局的系统性远征。要看清其全貌,我们需要跳出单一视角,从科学、技术 ... 宇宙探索04-13
相关文章
- 人类探索宇宙的意义何在
- 数据时代正在重新定义科研:本科生如何借助工具发现宇宙新事物?
- 人类为什么要探索宇宙
- 《宇宙探索编辑部》:科幻外壳下的教育隐喻
- 航天科技如何推动人类探索宇宙
- 全球首个地月太空港口落地中国!钱学森百年构想,成深空探索枢纽
- 别再说太空探索是烧钱!中国这波基建,直接把宇宙当工地
- 沉浸在书中的宇宙,探索无尽的星空!📖✨
- 中国第二阶梯
- 刘慈欣科幻漫画宇宙探索中心本周六开放,早鸟票已开售
- 刘慈欣科幻漫画宇宙探索中心落户通州,本周六迎客
- 提前探访,先睹为快!刘慈欣科幻漫画宇宙探索中心落户通州
- 太棒了!刘慈欣科幻漫画宇宙探索中心落户北京通州!周六迎客
- 刘慈欣科幻漫画宇宙探索中心本周通州迎客!
- 为何天上有颗“深圳星”?深圳科技馆馆长跟你聊宇宙探索、讲科学故事
- 从量子科技到元宇宙的崭新探索:中国科技为何引起全球瞩目?
- 显微镜下的奇妙世界:探索微观宇宙的无限奥秘
- 《宇宙探索编辑部》追了半生宇宙,才懂平凡人间,才是终极答案
- 一个国家插入另一个国家?
- 探索微观宇宙,见证科技奇迹!🔍🔬✨
热门阅读
-
预言2030年太阳将休眠,恐怖的千年极寒将来临 07-11
-
中国十大元帅之死,多高寿而善终(林彪叛逃而死) 07-11
-
因果报应真实事例,做尽坏事必遭天谴 07-11
-
这6个神奇天体有很酷的名字 06-01
-
全球人口减少可能带来的六大教训和好处 07-18
-
离太阳最近的十大恒星排名,宇宙最大十大星球 04-12
精选文章
- 创生之柱是什么?(创生之柱给予了许多恒星生命)
- 中国51区秘密基地,窃密必被抓(抓住就杀头)
- 中国“天宫”空间站将在2022年前后建成 呈T字型有三个舱段最多可驻留6人 ...
- 2025年宇宙探索大爆发!月全食、火星冲日等,这些天文奇观别错过
- 中国古代四大凶兽,四大神兽vs四大凶兽谁更强
- 黑龙江50万年死火山苏醒, 内含15%电量的巨大岩浆囊
- 新冠病患康复后,可能“精子减少或无精”
- 误会一辈子!破伤风其实是一种细菌跟生锈铁完全没关系
- 美国同步空间态势感知项目(GSSAP)军事间谍卫星多次秘密靠近俄罗斯和中国的航天器 ...
- 中国长征五号B遥一运载火箭全貌曝光 本月底在海南文昌航天发射场进行首次发射 ...
