比GPT-4快18倍,世界最快大模型Groq快速证伪?

今天讨论了一天的groq,结论就是同样完成LLaMA 70b 模型推理,采用 int8 量化,运行三年的话,Groq 需要的硬件采购成本是576卡1144 万美元,运营成本是 76.2 万美元或更高。H100的硬件采购成本是 8卡30 万美元,运营成本是 7.2 万美元或略低。
为什么需要576张,有海外大神专门算过,另一位技术大牛也做了类似的计算,groq没有显存仅仅靠SOC SRAM,假设有230MB的SRAM , 运行一个INT8的 llama-70B=70GB/0.23GB = 305张卡,考虑到SRAM利用率等各种问题,预计需要320张卡,每个服务器智能插入8张卡,分摊成本每张卡不低于2500$(卡0元计算),也就是服务器40台+交换机, 大概150万美元可以运行llama-70B。如果换成A100的8卡,大概INT8能够做到100token/s.,也就是120万人民币投入。
结论就是,Groq看起来效果惊人,但一算TCO,根本不具有经济性...那个效果吓人的视频,揣测下,是不计成本的堆卡堆出来的。诚然这个架构有其特点,比如NV大佬提到的针对bs1做了优化,的确在小batch size尤其是bs1显示出了优势,但可能也就在小模型、本地或者线上定制化推理服务能有限场景,一旦到了云端大规模集群推理,就不可用了,尤其是GPU或者大厂ASIC被充分优化、且利用率又比较高的场景。
这个路子是否成立都是个问号,groq还有个前辈graphcoe,其sram是groq的2.5倍,现在公司生意都快没了(除了前两天融资)...最致命的问题是,这种架构仅存只有SRAM(没错,这是短板...先不管你股票咋炒的)。
目前的计算架构存储层级是这样的,register file->SRAM->HBM->DDR->NAND->不常用的数据还可以offload到Disk,从左到右速度和和带宽都在降低,比如access SRAM 带宽认为约等于无限 一次ACCESS 2ns delay (先进工艺下),Acess HBM可能是几个micro second,Access NAND是milli second量级。但从左到右单bit的成本在依次降低。
说白了,最左边,无限快,但你用不起,往右边,贼便宜,但不够快。而目前LLM大家天天念叨的内存墙瓶颈,尤其是推理只做一次前向计算所有的参数要遍历一遍,因此需要
1)存的足够大;
2)读取也要足够快。
结论:LLM需要的存储要在成本可控的前提下,在速度和容量之间做一个折中和平衡。因此才有了HBM的大规模应用,这是产业的选择(最早是AMD),综合考虑了量产难度、成本、速度、工程实现性等等。下一步最多如大家讨论的HBM4与逻辑堆叠或者chiplet,但你说换掉HBM?步子迈太大了...不管存内计算近存计算存内处理,一旦到了工程实现性、良率就不吱声,再考虑经济性就歇菜。

我会在 公众号:海涵财经 每天更新最新的华为概念、创新减肥药、数字经济、ChatGPT、AI算力、CPO/硅光芯片、大数据、6G卫星、数据要素、医疗新基建、一体化压铸、 汽车智能化,激光雷达,HUD,车规芯片,空气悬挂、L3级智能驾驶、PET铜箔,纳电池,800V高压,光伏HJT、TOPCON、钙钛矿、光伏XBC、BIPV、IGBT芯片、碳化硅SIC、CTP/CTC/CTB电池、4680电池、工业母机、海风柔直高压、新能源车高压快充、高镍三元、碳纤维、PET铝箔、PET铜箔、空气源热泵、新材料、中药创新药、中药配方颗粒、乡村振兴、锂矿、钒液流电池、钠离子电池、分布式储能、集中式储能、抗原检测等最新题材热点挖掘,未来属于高预期差的结构性市场,把握核心赛道以及个股的内在价值逻辑预期差才是根本所在。
— END —
先赞后看,养成习惯
免责声明:图片、数据来源于网络,转载仅用做交流学习,如有版权问题请联系作者删除
大家都在看
-
世界上崛起速度最快的小国,从濒临亡国到区域霸主,只用了50年 从世界历史来看,大国的崛起那是屡见不鲜,而且世界历史的走势,本质上就是大国崛起的走势。所以世界权力本质上掌握在大国手中,小国处于被支配地位。而且在大国博弈中,往往当做炮灰的就是小国,最典型就是乌克兰。 ... 世界最快05-01
-
诺奖得主与沪上大中学生畅谈发明世界上“最快的相机” “阿秒是10的负18次方秒,而1阿秒是多快?”昨天(4月18日),第十四期“浦江科学大师讲坛”在复旦大学相辉堂举行。诺贝尔物理学奖得主、瑞典隆德大学教授、瑞典皇家科学院院士安妮·吕利耶,以“阿秒脉冲的探索之旅 ... 世界最快04-23
-
发明世界上“最快的相机”,诺奖得主复旦开讲! “阿秒是10的负18次方秒,而1阿秒是多快?”今天(4月18日)上午,第十四期“浦江科学大师讲坛”在复旦大学相辉堂举行。诺贝尔物理学奖得主、瑞典隆德大学教授、瑞典皇家科学院院士安妮·吕利耶(Anne L'Huillier) ... 世界最快04-19
-
10个世界上最快的人造物,打破了物理限制,快到让你怀疑人生。 1.SR-71黑鸟式侦察机。说起人类历史上最不讲道理的飞机,SR-71“黑鸟”要是排第二,估计没谁敢认第一。这家伙长得就像个压扁了的黑色大梭子,是上世纪60年代冷战时期的产物。它的性能简直离谱。时速能飙到3500多公里 ... 世界最快04-10
-
世界最快科学装置是什么 世界最快科学装置是湖北东湖实验室的1公里高速磁悬浮测试线。它在测试中创造了800公里/小时的纪录,刷新了同类型平台的世界纪录,成为地面高速动模型测试领域的“世界第一快”。速度:眨眼间的极速2025年11月24日, ... 世界最快04-08
-
本田翼在电视节目上坦白了洗澡时间 在场人员吃惊:“世界最快?” 33岁的日本演员兼模特本田翼于30日做客朝日电视台的《Ano Channel》节目。她在节目中透露了自己的洗澡时间后,震惊了现场的合作演员们。该期节目以“我爱宅在家”为主题,邀请了许多喜欢宅在家里的艺人参与访谈。当 ... 世界最快04-04
-
速度达10米/秒 全球最快人形机器人Bolt正式发布 据浙大杭州国际科创中心(后称科创中心)消息,2月2日,科创中心人形机器人创新研究院正式发布全尺寸人形机器人Bolt。该机器人以10米/秒的奔跑时速,成为目前全球跑得最快的人形机器人。这一成果由科创中心联合镜识 ... 世界最快04-04
-
世界最快!时速800公里,在武汉! 12月25日,记者从湖北东湖实验室获悉,科研人员通过悬浮支撑和电磁推进的方式,仅用5.3秒就将1110公斤重的高铁模型车加速至每小时800公里。这是过去半年间,东湖实验室第三次打破同类型平台世界纪录。今年6月16日, ... 世界最快04-04
-
世界上最快的人!奔跑时速48公里,比猎豹还快 眼前这个长相奇特的男人就是目前地球上已知跑的最快的人类扎佐尔,他的奔跑速度完全碾压世界短跑冠军博尔特。也正因为扎佐尔跑的足够快,所以他选择做了一名全职杀手,因为就连警车都追不上他的奔跑速度。今天就来说 ... 世界最快03-23
-
两小时建交,全球最快,背后到底图啥? 2002年5月20日零点,东帝汶正式独立。凌晨两点,中国就派代表签了建交文件——比很多邻国早半天,比联合国多数国家早好几天。这事当时没上热搜,也没刷屏,但真挺特别的。一个小国,刚从战火里爬出来,没矿没港没军 ... 世界最快03-21
相关文章
- 两小时建交,全球最快,背后到底图啥?
- 全球最快高铁要来了,时速453公里刷新纪录,明年将开展全面测试
- 全球最快的 10 列超级列车:第一名时速 603 公里,比客机起飞还快 50%
- 时速800公里!世界最快!就在湖北
- 速度堪比“飞人”博尔特,全球跑得最快的人形机器人来了
- 全球“最快”人形机器人发布
- 全球最快人形机器人Bolt发布
- 世界上最快的速度,不是光,也不是电,究竟是什么呢?
- “全球最快高铁”就要来了
- 全球最快高铁要来了,中国高铁里程是其他国家总和的两倍
- 700 公里每小时,中国速度全球最快
- 世界最快!时速800公里
- 全球最快,破纪录!
- 全球最快!两秒内加速至700公里/小时
- 又是全球最快!中国造船不断打破自己创造的纪录
- “全球最快高铁”如何炼成
- “全球最快高铁”要来了!
- “全球最快高铁”,有新消息!
- 全球最快动车组,正在“刷里程”
- “全球最快高铁”,有新消息
热门阅读
-
世界最快的个人潜艇,数秒潜入100米 09-29
-
世界上最快的手指,一秒钟敲击琴键13次 10-12
-
世界上速度最快的卡车,能达到每小时644公里 10-28
-
世界上飞行最快的鸟,灵活的军舰鸟 04-26
