比GPT-4快18倍,世界最快大模型Groq快速证伪?

今天讨论了一天的groq,结论就是同样完成LLaMA 70b 模型推理,采用 int8 量化,运行三年的话,Groq 需要的硬件采购成本是576卡1144 万美元,运营成本是 76.2 万美元或更高。H100的硬件采购成本是 8卡30 万美元,运营成本是 7.2 万美元或略低。
为什么需要576张,有海外大神专门算过,另一位技术大牛也做了类似的计算,groq没有显存仅仅靠SOC SRAM,假设有230MB的SRAM , 运行一个INT8的 llama-70B=70GB/0.23GB = 305张卡,考虑到SRAM利用率等各种问题,预计需要320张卡,每个服务器智能插入8张卡,分摊成本每张卡不低于2500$(卡0元计算),也就是服务器40台+交换机, 大概150万美元可以运行llama-70B。如果换成A100的8卡,大概INT8能够做到100token/s.,也就是120万人民币投入。
结论就是,Groq看起来效果惊人,但一算TCO,根本不具有经济性...那个效果吓人的视频,揣测下,是不计成本的堆卡堆出来的。诚然这个架构有其特点,比如NV大佬提到的针对bs1做了优化,的确在小batch size尤其是bs1显示出了优势,但可能也就在小模型、本地或者线上定制化推理服务能有限场景,一旦到了云端大规模集群推理,就不可用了,尤其是GPU或者大厂ASIC被充分优化、且利用率又比较高的场景。
这个路子是否成立都是个问号,groq还有个前辈graphcoe,其sram是groq的2.5倍,现在公司生意都快没了(除了前两天融资)...最致命的问题是,这种架构仅存只有SRAM(没错,这是短板...先不管你股票咋炒的)。
目前的计算架构存储层级是这样的,register file->SRAM->HBM->DDR->NAND->不常用的数据还可以offload到Disk,从左到右速度和和带宽都在降低,比如access SRAM 带宽认为约等于无限 一次ACCESS 2ns delay (先进工艺下),Acess HBM可能是几个micro second,Access NAND是milli second量级。但从左到右单bit的成本在依次降低。
说白了,最左边,无限快,但你用不起,往右边,贼便宜,但不够快。而目前LLM大家天天念叨的内存墙瓶颈,尤其是推理只做一次前向计算所有的参数要遍历一遍,因此需要
1)存的足够大;
2)读取也要足够快。
结论:LLM需要的存储要在成本可控的前提下,在速度和容量之间做一个折中和平衡。因此才有了HBM的大规模应用,这是产业的选择(最早是AMD),综合考虑了量产难度、成本、速度、工程实现性等等。下一步最多如大家讨论的HBM4与逻辑堆叠或者chiplet,但你说换掉HBM?步子迈太大了...不管存内计算近存计算存内处理,一旦到了工程实现性、良率就不吱声,再考虑经济性就歇菜。

我会在 公众号:海涵财经 每天更新最新的华为概念、创新减肥药、数字经济、ChatGPT、AI算力、CPO/硅光芯片、大数据、6G卫星、数据要素、医疗新基建、一体化压铸、 汽车智能化,激光雷达,HUD,车规芯片,空气悬挂、L3级智能驾驶、PET铜箔,纳电池,800V高压,光伏HJT、TOPCON、钙钛矿、光伏XBC、BIPV、IGBT芯片、碳化硅SIC、CTP/CTC/CTB电池、4680电池、工业母机、海风柔直高压、新能源车高压快充、高镍三元、碳纤维、PET铝箔、PET铜箔、空气源热泵、新材料、中药创新药、中药配方颗粒、乡村振兴、锂矿、钒液流电池、钠离子电池、分布式储能、集中式储能、抗原检测等最新题材热点挖掘,未来属于高预期差的结构性市场,把握核心赛道以及个股的内在价值逻辑预期差才是根本所在。
— END —
先赞后看,养成习惯
免责声明:图片、数据来源于网络,转载仅用做交流学习,如有版权问题请联系作者删除
大家都在看
-
全球最快轰炸机:13000公里作战半径,美军为何害怕 说起轰炸机,大家可能最先想到的就是美国B-2轰炸机。作为世界上唯一一种隐身战略轰炸机,确实就是轰炸机中的明星。但是军事大国不止只有美国,俄罗斯也是军事大国。要问俄罗斯最先进的轰炸机,就不得不说图-160了。 ... 世界最快06-12
-
132GHz!中科院研制出世界最快硅-石墨烯-锗晶体管!!! 到底突破了什么?6月8日,中科院传来了一个振奋人心的好消息:我国科学家成功研制出了国际上首款硅-石墨烯-锗势垒晶体管,其截止频率达到了132GHz,创下了世界纪录。而且,这还远远不是终点。从理论上讲,这种新型晶 ... 世界最快06-10
-
全球最快!12.8T光模块亮相光博会 产业链预研加速 光通信圈热议“超级周期” 财联社5月20日讯(记者 付静)AI算力基建浪潮席卷全球,光通信正经历超级周期,其中最受关注的光模块可谓AI时代“数据血脉”。日前,财联社记者在武汉光谷举行的第二十一届“中国光谷”国际光电子博览会(以下简称“ ... 世界最快05-26
-
曝GPT-5.5用上“全球最快芯片”,Claude慌了 120B模型飙到2000 token/秒,CFO更放话已在跑GPT-5.5!Cerebras 560亿美元IPO首日暴涨68%,但SemiAnalysis万字拆解直指死穴。SemiAnalysis,硅谷最硬核的芯片分析机构,4月份光是AI工具的订阅费就烧到了年化1000万美 ... 世界最快05-23
-
“九章四号”造出来了!速度比全球最快超算还要快10的54次方倍? 文:纵马封川编辑:离歌5月13日这个周三,国际顶级学术期刊《自然》杂志一篇论文刷屏了。中国人把"九章四号"造出来了!什么概念?25微秒对10的42次方年,比目前全球最快的超级计算机还要快10的54次方倍。25 ... 世界最快05-20
-
苏州小伙,全球爬得最快 5月10日2026年世界攀联攀岩世界杯(中国吴江汾湖)圆满落幕在当晚举行的男子速度赛决赛中苏州17岁小将赵一程在家乡父老的注视下斩获男子速度赛金牌上演了“12天两破世界纪录”的传奇时刻苏州选手赵一程(左)作为中 ... 世界最快05-15
-
“九章四号”造出来了,速度比全球最快超算还要快10的54次方倍 “九章四号”造出来了,助力我国再次站上量子计算之巅峰。据央视新闻5月13日报道,中国科学技术大学潘建伟、陆朝阳等团队联合多家机构,成功研制出九章四号可编程光量子计算原型机,一举刷新光量子计算全球纪录,科 ... 世界最快05-14
-
10年升0.56℃!报告警示:欧洲变暖最快,超全球平均速度两倍 如果说全球变暖是一场缓慢燃烧的大火,那么欧洲可能已经站在最靠近火焰的地方。最新发布的《2025年欧洲气候状况》报告表明,欧洲是全球变暖最快的大陆。不是最热的地方,却是升温速度最惊人的大陆之一。世界气象组织 ... 世界最快05-13
-
实现50分钟成渝通勤!“全球最快高铁”,要来了 据央视新闻报道被称作“全球最快高铁”的CR450动车组正在沪渝蓉高铁开展运用考核明年将会在成渝中线展开更接近运营条件的全面测试2021年,“十四五”规划102项重大项目之一的CR450科技创新工程启动,去年年底,CR450 ... 世界最快05-13
-
造车8个月,它带来了全球最快的车 中国正式成为了全球顶尖的汽车大国,随便一家企业入场造车都是手拿把掐,从宣布造车到实车发布,只需要8个月时间!放眼全球,有哪个品牌能如此“高效”?用火箭般的速度,打造了速度媲美火箭的超跑,实现这一壮举的 ... 世界最快05-04
相关文章
- 苏州小伙,全球爬得最快
- “九章四号”造出来了,速度比全球最快超算还要快10的54次方倍
- 世界上最快的脚步,不是冲刺而是坚持
- 10年升0.56℃!报告警示:欧洲变暖最快,超全球平均速度两倍
- 实现50分钟成渝通勤!“全球最快高铁”,要来了
- 造车8个月,它带来了全球最快的车
- 世界上崛起速度最快的小国,从濒临亡国到区域霸主,只用了50年
- 诺奖得主与沪上大中学生畅谈发明世界上“最快的相机”
- 发明世界上“最快的相机”,诺奖得主复旦开讲!
- 10个世界上最快的人造物,打破了物理限制,快到让你怀疑人生。
- 世界最快科学装置是什么
- 报告:中国成为世界上增绿最多最快的国家
- 本田翼在电视节目上坦白了洗澡时间 在场人员吃惊:“世界最快?”
- 速度达10米/秒 全球最快人形机器人Bolt正式发布
- 世界最快!时速800公里,在武汉!
- 世界上最快的人!奔跑时速48公里,比猎豹还快
- 两小时建交,全球最快,背后到底图啥?
- 全球最快高铁要来了,时速453公里刷新纪录,明年将开展全面测试
- 全球最快的 10 列超级列车:第一名时速 603 公里,比客机起飞还快 50%
- 时速800公里!世界最快!就在湖北
热门阅读
-
世界最快的个人潜艇,数秒潜入100米 09-29
-
世界上最快的手指,一秒钟敲击琴键13次 10-12
-
世界上速度最快的卡车,能达到每小时644公里 10-28
-
世界上飞行最快的鸟,灵活的军舰鸟 04-26
