智源大会最清醒的一句话:大模型的下一场仗,不在屏幕里打了
(本文作者为 节点AI,钛媒体经授权发布)
文/ 节点AI ,作者 / 郭添
北京智源大会来到了第二天,会场里的气氛变了。
前一天更像技术阅兵,大家大谈特谈大语言模型对社会的影响,对未来技术发展的期望,毕竟技术范式已经收敛,这条赛道更多是确定性。
第二天就不同了,摆在行业面前的下一道题是如何让机器理解真实物理世界,机器能快速算出高难度数学题,但它并不知道桌上的咖啡杯滑落桌沿会怎样?数据与硬件是两座大山,山顶很清楚了,但该沿着哪条路登山,还是未知。
智源研究院院长王仲远和银河通用创始人兼CTO王鹤的观点,在我看来最值得看,他们两个一个要重新定义世界模型,另一个选择要先让机器人学会打网球。看起来风马牛不相及,底层逻辑却是同一个:AI必须学会跟真实世界打交道。
所有夺冠的世界模型,都还不是真正的世界模型
“所有夺冠的世界模型,都还不是真正的世界模型,视频生成模型不等于世界模型。”,智源研究院院长王仲远在会场说出这句话的时候,台下安静了几秒。
过去半年,世界模型火得发烫,但概念的误用同样泛滥。王仲远认为,误用的源头是OpenAI发布Sora时用了World Simulator的表述。他举了个一听就懂的反例——视频生成模型可以做出一群猪在天上跟飞机一起飞的画面,因为训练数据里有大量科幻电影。它学会了好莱坞的想象力,但不懂牛顿万有引力。
为此,智源特意为世界模型分为四类。第一,以语言为中心的,时下大热的VLM/VLA;以像素为中心的,比如Sora、Seedance等视频生成;以三维结构为中心的,比如3D重建/李飞飞团队的World Labs Marble;以视觉表征为中心的,比如,杨立昆的JEPA系列。
四条路线各有进展,但他的判断,这几类的发展都还不够。
智源选择了第五类——全模态潜空间,把文本、图像、视频压缩到统一的向量空间,建模真实物理世界的状态。这个思路跟智源此前登上《Nature》正刊的悟界Emu一脉相承。为什么智源要独占一类呢?王仲远也坦承,这条路没有完全走通,因此暂不急于归类。
谈到李飞飞将世界模型分为渲染器、模拟器和规划器三类,王仲远没有回避对比:“她的分类有她的逻辑,但我们的分类更具通用性。未来不排除走向大一统。”
下一个Token预测是大语言模型的核心,那对世界模型呢?在王仲远看来,则是下一个物理状态预测。
他用生活场景解释什么才算真正的世界模型能力。一杯咖啡放在桌子边缘,跌落时会发生什么,人类一看就知道。一个3岁小朋友睡着了,厨房传来很大的声音,家人只要挥一下手,其他人就知道该去关门。不用说话,不用解释。这种感知-预测-决策的闭环,是人类天生的世界模型,也是机器远未掌握的能力。
智源已经在构建评测数据集,评测框架预计下半年发布。切入点选得很具体:开冰箱、开洗衣机、开微波炉。同样是"打开"这个动作,不同设备有旋转式、按压式、触碰式的差异。加热饭菜时,知不知道铁碗不能放进微波炉?因为可能产生火花。人类觉得这是常识,机器觉得这是难题。
王仲远对整个行业的进度判断是冷静的:至少还需要好几年。不管国内还是国外,世界模型都还处于早期。
但早期不是等待的理由。
智源研究院已经行动了起来,在大会上发布了正在研发中的悟界·Physis-v0.1,以物理空间建模实现下一个物理状态预测为核心,定位全球首个通用世界基座模型。模型还在训练阶段,下半年持续分享进展,训练完成后开源。
王鹤:先打赢网球,构建坚实护城河
如果王仲远在定义AI该怎么"想"世界,银河通用创始人兼CTO王鹤就更直接了,他要解决的问题更野蛮,让机器人"动"起来。从想再到执行,刚好是一个闭环。
银河通用选的突破口让很多人意外——让机器人学会打网球。
今年3月,银河通用推出了latent算法,让人形机器人具备了长程动态打网球的能力。
打网球可不简单,同时考验两件事——手腕精确控制击球区(运动控制),以及判断该吊球还是打空档(大脑层策略决策)。
对于数据难的问题,银河通用的技术路径是动作捕捉部分真人数据,让机器学会关键动作,再叠加强化学习,提升泛化能力,最终实现机器人能跟真人对打。
当时,我记得这事还在x上还引起了一波讨论,Ai圈明星企业家、研究院,Elon Musk和Andrej Karpathy都注意到了这件事。
王鹤本人更愿意把这叫做具身智能的AlphaGo时刻。
这不,才3个月过去,银河通用又提出了World Action Model(WAM)范式,据悉融合VLA和世界模型,同时吃有标签的具身数据和海量无标签的人类第一人称视频。
银河通用是具身智能企业里坚定的合成数据派,这是技术壁垒。在WAM出现之前,团队用10亿帧仿真数据跑通了一个结论:只要把数据Scale到这个程度,就可以完全实现zero-shot,在真实世界随便给一个东西,就能搞定抓取。
当然,技术永远不是什么护城河,王鹤本人也不是没准备,他在大会上把护城河拆成了四个维度:数据供给、多类型数据提炼能力、硬件迭代与软硬协同设计、模型交付给客户的整套能力。他说了一句很有底气的话:全世界范围内还没有这么综合的一个产品,具身智能的护城河相当深。
这句话不是空话。宁德时代、博世既是银河通用的投资人也是客户,投资+采购+验证三位一体,比纯技术更难复制。银河通用同时覆盖工业重载和商业零售两条产品线,宁德时代的产线和100多家无人便利店都已经跑起来了。
但他也没回避现实的严峻。王鹤给出了一个让人倒吸一口气的投入门槛:行业需要千万小时级别的数据、百亿以上单年的投入,才能拿到冲刺ChatGPT时刻的入场券。现如今,银河通用70亿融资、200亿估值,离这个门槛还有距离。特别的是,国内具身智能创业公司已有约230家,赛道拥挤,谁能走出来还是未知数。
他还说了一句不太客气的话:真正愿意做实事的人少,愿意卖硬件、卖平台的人多。
大会上最后一个问题很尖锐:中国AI和欧美AI会走出不一样的路吗?王鹤的回答是:我相信具身是中国的机会。如果0到1在中国完成,那1到100必定是在中国成熟的。这不是空想,去年中国制造的人形机器人占全球交付量的87%。
王鹤给出的时间表是两年。两年后具身智能能不能从GPT-2进化到ChatGPT,也决定了70亿融资和200亿估值究竟是不是泡沫。
智源大会第二天收尾时,两条AI战线的图景已经清晰:世界模型要教AI理解物理规律,具身智能要让机器人用身体执行,共同点是:都还处在早期,都缺数据,都没有公认的评价标准。
不过,有一点可以确认,大模型的下一场仗,不在屏幕里打了。
大家都在看
-
陈晓平:诗家末路依唐家——金和、倪鸿与唐廷枢兄弟的故事 晚清就业形势进一步恶化。体制边缘的诗人金和、倪鸿走到末路,入轮船招商局、开平矿务局工作。有文才而无领兵、治事之能,若非有力者托举,在急剧转变的社会不免狼奔豕突。新兴产业容纳不了太多文人,两人能找到出路 ... 机械之最06-13
-
机械专业真实现状:不是所有人都适合学,想清楚这几点再决定 你以为机械就是“拧螺丝”?实打实讲, 在我国上大学以前之时, 针对机械的领会也就是“创置机器”、“旋拧螺丝”、“于工厂里做杂役之类不关键之活儿”这样的情况了。身旁的亲戚一旦听闻你专门学习机械这个专业, 其眼 ... 机械之最06-13
-
白玉京:马斯克画的是蓝图,还是大饼? 【文/观察者网专栏作者 白玉京】 近日,蓝色起源新一代重型运载火箭在地面测试中发生爆炸,巨大的火球与滚滚浓烟很快登上全球社交媒体热搜。事故之后,美国国家航空航天局(NASA)局长艾萨克曼赶到爆炸现场。商业航 ... 机械之最06-12
-
军营观察丨“山峰”组合成长记 初夏时节,渤海湾畔海风习习。海军某中心军士技能大师工作室内,三级军士长张庆山带着几名战友反复推敲装备维修革新方案,张庆山的徒弟、中士冯雪锋紧盯屏幕,一点点调试模块参数。张庆山和冯雪锋被战友们亲切地称为 ... 机械之最06-12
-
回到物理学坐标上!培育钻石以极致导热,扛起AI芯片散热重任 【环球网财经报道 记者 冯超男】谁也未曾料到,用来见证爱情的钻石,如今扛起了为 AI 芯片“退热”的重任。凭借着卓越的导热性,培育钻石,也就是人造金刚石,强势闯进了当下炙手可热的AI赛道。甚至,英伟达都亲自下 ... 机械之最06-12
-
洗地机vs扫拖一体机器人vs吸尘器:2026三选一,按户型选不踩坑 谁家遇到干家务这事,真的都挺让人头疼的。虽然说现在清洁家电非常多,洗地机、扫拖机器人、无线吸尘器,但如何去用很多人也分不清,如果都买下来,价格起码也得1万往上并不便宜。很多人就是比较难分清楚区别,有的 ... 机械之最06-12
-
关徽耀国门 实干淬担当——聆听他们守关强国的故事 新华社北京6月11日电 题:关徽耀国门 实干淬担当——聆听他们守关强国的故事新华社记者邹多为当巨轮满载国货出海,当进口水果抢“鲜”入境,当走私违规无处遁形……货物贸易第一大国阔步向前的背后,饱含无数海关人 ... 机械之最06-12
-
活力中国调研行丨“大脑秘境”如何让患者“遇见光” 大脑是人体最精密也最神秘的器官。夏日的午后,“活力中国调研行”记者团来到位于北京昌平的北京脑科学与类脑研究所。金色的阳光透过玻璃洒进实验室。一项项深耕脑科学前沿的探索正在持续推进并加快走进病房,为患者 ... 机械之最06-12
-
扎根在一线 奋斗正当时(下) 田野间的“天耕客”■ 杨 川 河北邯郸 新农人杨 川 金 立摄爷爷赶着黄牛耕田,爸爸开着拖拉机种地……大学毕业后,我把无人机带进田野,接过家里的“接力棒”,成了一名新时代“天耕客”。2002年,我出生在河北省邯 ... 机械之最06-11
-
扎根基层 科技报国——央企青年代表共话使命担当 新华社北京6月10日电 题:扎根基层 科技报国——央企青年代表共话使命担当新华社记者赵怡宁青年强,则国家强。在全面建设社会主义现代化国家新征程上,广大中央企业青年科技人才扎根一线、坚守岗位,用青春智慧服务 ... 机械之最06-11
相关文章
- 新华社文化随笔:当非遗成为“中式生活指南”
- 三峡水运新通道为何如此重要?将带来什么?
- 机械专业真实现状:不是所有人都适合学,想清楚这几点再决定
- 机械专业最怕的,不是进厂,而是起点选错
- 机械设计制造及其自动化各分数段推荐院校,就业最广,闭眼入
- 白玉京:马斯克画的是蓝图,还是大饼?
- 在同山共脉的吉尔吉斯斯坦“看见中国”
- 军营观察丨“山峰”组合成长记
- 回到物理学坐标上!培育钻石以极致导热,扛起AI芯片散热重任
- 洗地机vs扫拖一体机器人vs吸尘器:2026三选一,按户型选不踩坑
- 关徽耀国门 实干淬担当——聆听他们守关强国的故事
- 活力中国调研行丨“大脑秘境”如何让患者“遇见光”
- 扎根在一线 奋斗正当时(下)
- 扎根基层 科技报国——央企青年代表共话使命担当
- 马钧:被低估的三国“机械天才”
- 钉钉歪了,阿里能一锤敲正吗?
- “数智化不是选答题,而是必答题”
- 经常出现这种情况 可能是牙齿在“求救”!千万别大意
- “这座博物馆始终是一个鲜活的工厂”
- 塞牙,可能是你的牙在喊“救命”!别不当回事……
热门阅读
-
天下第一暗器暴雨梨花针,传说中的唐门暗器做出来了 07-13
-
汽车投诉排行榜前十名汽车 问题最多的就是这些车 07-13
-
世界上最牛挖掘机,甚至可以挖穿一座城市 11-05
-
世界最大核潜艇制造厂,产量远超中美法 11-20
-
我国在职正部级领导中,最年轻的是这5人! 08-30
