大模型依赖算力“大力出奇迹” 2024世界人工智能大会与会人士建议发展分布式推理降低算力成本
央广网北京7月6日消息(记者吕红桥)据中央广播电视总台经济之声《天下财经》报道,2024世界人工智能大会6日继续举行。一场分论坛重点关注的是如何降低算力成本。对大模型来说,算力越大越好,业内形象地说是“大力出奇迹”,然而,大算力意味着巨大的成本。如何在满足算力需求的情况下,降低算力成本?业内人士和专家提出了解决方案。
训练大模型,有“大力出奇迹”的说法,也就是说,算力越大,大模型可能越完善。正因如此,有测算显示,大模型训练成本70%用于算力,推理成本95%用于算力。在当前“百模大战”的背景下,要让大模型训练可持续,就必须降低算力成本。对于降成本的路径,燧原科技创始人兼首席运营官张亚林在论坛上表示,可以把大模型的推理放到边端,通过分布式推理降低算力成本。
张亚林介绍:“中国不缺应用场景、大量的端侧和边侧设备,未来端侧和边侧设备一定具有很高算力,大家看到AI PC、AI Phone已经起来。如何做分布式推理?举个例子,目前主要的手机应用都是在云端做推理。如果手机端算力能够把简单任务做了,所有省下来的成本都归手机应用公司。如果能干掉50%的推理,就能省50%的成本。所以,中国未来一定是从边侧到端侧,再到云侧的分布式推理。”
对于降低算力成本,中国工程院院士、清华大学教授郑纬民之前表示,我国现在有多个国家挂牌的算力系统,有的系统还有空余算力,这些算力也可以用来训练大模型,并且成本很低。在这场论坛上,郑纬民进一步表示,从实际尝试来看,用原有算力系统富余的算力训练大模型,成本只有原来的六分之一。
郑纬民说:“我们试了一下,把我们的一套东西加到里面。比如‘八卦炉’是10个软件,把这10个软件加到机器上。目前‘八卦炉’已经在国产算力系统中成功移植百川、LLaMA等大模型,最后结果很不错。”
降低算力成本的另一个思路是提高算力的使用效率。单个大模型训练所用的算力规模非常大,一万张算力卡组成的“万卡集群”已经成为大模型预训练的最低配置。然而在实践中,“万卡集群”的使用效率经常在50%以下,也就是说,一半以上的算力都不能发挥出来。曦智科技首席技术官孟怀宇分析,这主要是因为算力卡之间的互联,也就是“南向”互联效率太低导致的。他表示,增加“南向”互联超节点的规模,可以大幅提升算力使用效率。
孟怀宇说:“当我们从万卡集群的角度来看的时候,实际上是‘南向’的超节点规模在一定范围之内越大,GPU的利用率就越高,得到的算力会越高。这样,整个集群在卡数不增加的情况下,会得到更高的性能,也就意味着性价比更高。根据结果显示,在GPU卡数不增加的情况下,32卡的南向节点相对于8卡来说,可以获得88%的性能提升。”
数据中心与算力降成本密切相关,当前,不少数据中心并没有形成畅通的盈利模式。张亚林认为,数据中心应该改变以往的建设、运营和应用模式。
张亚林表示:“以前的模式是先建设,再找运营,找了运营再找应用。现在应该是反过来,有人来使用才算得过来账,才能去找运营。有了运营,才能够说谁来建设。这才是中国AIDC(智算中心)商业模式最关键的健康生态。其实整个商业模式非常简单,算力卡月租多少钱?能不能按照月租费用把整个投入收回来?这其实是中国在算力上需要解决的问题。”
大家都在看
-
起诉美国国防部,温州首富硬刚!药明康德的故事是爱与坚韧的赞歌 6月11日,药明康德正式对美国国防部提起诉讼,要求将其从“中国军工企业”黑名单中移除。这家由温州籍企业家李革创办的千亿级医药巨头,以强硬姿态回击无端打压。就在此前,公司刚刚交出亮眼成绩单:2026年一季度营 ... 商业之最06-13
-
胖东来于东来:高薪溺爱员工,走出就完蛋!狠不起来是致命伤 年入235亿、净利润超15亿、员工平均月入9000元,胖东来无疑是中国零售界的顶流神话。创始人于东来却突然泼下一盆冷水:“大家其实不值这么多钱!”一句惊世骇俗的断言瞬间引爆舆论场。他直言高薪产生了溺爱,让员工 ... 商业之最06-13
-
法律上有理,不等于舆论场占理——遇见小面即使赢了也是得不偿失 近日,主打川渝风味的连锁餐饮品牌“遇见小面”上演了一出堪称教科书级别的“负面舆情”案例。一场针对河南南阳一家夫妻店“渝见小面”的商标诉讼,不仅没能起到保护品牌的作用,反而将这家准上市公司推向了舆论的风 ... 商业之最06-13
-
一字之差,真的就能把一家小面馆推上风口浪尖吗? 最近,重庆这位开面馆的女子,恐怕怎么也没想到,自己精心起的名字“渝见小面”,居然会被“遇见小面”盯上,直接告到法庭。消息一出,网友瞬间炸锅:这到底是正当维权,还是强行碰瓷?一碗面还没来得及端稳,先端上 ... 商业之最06-13
-
看懂所有商业底层:4大市场模型,看透世间所有生意 为什么菜市场小贩不敢涨价,奶茶店却能随意做活动提价?为什么通信、车企很少打价格死战,而水电燃气几乎没有竞争对手?所有商业现象的答案,都藏在经济学四大市场模型里。这是一套可以解释 90% 赚钱逻辑、行业格局 ... 商业之最06-13
-
权力的商业逻辑:为什么所有渠道的本质都是征税权 2026 年的今天,当一个服装品牌在天猫卖出一件 1000 元的连衣裙时,有 50 元自动划入阿里巴巴的账户;当一个餐饮商家在抖音完成一笔 200 元的团购订单,10 元作为技术服务费被平台扣除;当一个奶茶品牌入驻万达广场 ... 商业之最06-13
-
绝无仅有!全球最离谱回报率,22年前仅投入1元,如今身家8亿 一家年营收才十几亿的公司,突然在北非又签下一个10亿级合同,这还不算最抓眼的。真正让人后背一紧的,是这家公司当年差点被“放弃治疗”。6月9日晚,通源石油披露,中标阿尔及利亚国家石油公司两个油气服务标段,合 ... 商业之最06-13
-
埋在地下的超级中心!长沙西站,正在重塑河西商业重心 很多人关注长沙西站,大多聚焦于视觉导视、找车导航,却忽略了它地下布局背后的终极野心。这座深挖数层的大型枢纽,早已跳出 “车站” 的单一定位,而是在下一盘改变长沙河西格局的大棋。从超深基坑到全域地下连廊, ... 商业之最06-13
-
这就是赤裸裸的现实!现在中国银行已经不是央国企中的老大了 很多人对中国银行的印象,还停在一个特别“稳”的位置上:名字最响,气场最足,听着就像压轴出场的那位。可真要按今天的银行江湖排座次,它早就不是那个默认的第一名了。这话一说,估计有人先愣一下。不是吧,“中国 ... 商业之最06-13
-
大健康赛道的“钞能力”:解码百亿级商业帝国的底层逻辑 当行业周期剧烈震荡、资本潮水退去,真正锚定长期价值的企业,却在更深的海域构建起自己的商业帝国。科伦药业用三十年时间证明:大健康赛道能穿越周期的,从来不是风口上的投机,而是战略定力与技术深潜的乘积效应。 ... 商业之最06-13
相关文章
- 读懂胡雪岩的结局才明白:真正打败首富的,从来不是运气
- 商业的核心逻辑:深耕产品与销售,直击赚钱本质
- 专注一个领域,做到极致,才是普通人做生意最稳的暴富路
- 一些不外传的,经商铁律,48条人性铁律,值得收藏
- 靠茅台赚的十几亿都没了——昔日茅台最牛股东折戟安徽
- 穷小子到全球首富,杰夫贝佐斯是怎么把亚马逊做成地球最强公司的
- 人未赴德已掀资本狂潮!樊振东重塑欧洲乒坛商业格局
- 周德文以半生知行,立民营商业本心
- 康师傅蜜桃饮料风波:0.01克“特选水蜜桃”背后的商业逻辑
- 从茶楼跑堂到华人首富,李嘉诚的商业帝国是如何炼成的?
- 十七年招牌,信任该如何安放!
- 东方金字塔——淄博四王冢的千年传说
- 刘永行:兄弟分家后,他选了最苦的路,却成了中国最“硬”的老板
- 累计上万大学被骗鹅腿阿姨真象大白天下
- 一场“最不AI”的发布会,苹果在奉行“保守主义”?
- 460中国企业500强商业模式:湖南博长控股集团有限公司
- 从木材商到奢侈品帝国掌门人:弗朗索瓦·皮诺到底凭什么翻身?
- 威海老港12亿改造:9亿贷款+100%招商,商业价值红利有多大?
- 明明亏百亿还不裁员?京东最不值钱的是利润,最值钱的是人心
- 两大风口联手!看懂半导体与商业航天的联动逻辑
热门阅读
-
世界上最小比基尼,几根绳子也能叫比基尼 07-14
-
性主题餐厅 一个让人面红耳赤的地方 07-14
-
胡文海事件真相,以暴制暴杀了村干部等14人 07-14
-
好日子香烟价格,多款不同系列价格口感介绍 07-14
