刷屏WAIC,加速生成式AI落地终端,高通亮出诸多“黑科技”

智东西
作者 | 云鹏
编辑 | 漠影
今年科技圈最火热的话题,非生成式AI莫属,而生成式AI发展迭代的速度之快,也令人惊叹。
从GPT-3.5到GPT-4.0,从多模态交互融入到插件的支持,而曾经只能跑在云端的AI大模型,也开始在智能终端设备中落地。
没错,今天拥有数十亿、上百亿参数的AI大模型已经可以直接在你的手机上运行了。注意,是完全本地化运行,只依赖手机本身的算力。
这听起来似乎还有些遥远,但就在上周召开的上海WAIC上,我们已经看到搭载高通第二代骁龙8芯片的安卓手机直接运行参数规模超过10亿的Stable Diffusion,且只需要15秒左右就可以出图,而参数规模超过15亿的ControlNet也成功在手机终端上实现了本地化运行。

搭载骁龙芯片的手机运行Stable Diffusion,15秒左右出图,来源:高通
在WAIC上,我们还能看到各类生成式AI应用已经可以被越来越多的普通消费者通过身边的智能设备接触到。
AI正迎来大爆发时期,就像此前电视、互联网和智能手机的问世,而这种爆发对算力以及计算架构都提出了新的需求。AI训练和推理的成本显著提升,计算架构需要不断演进并满足生成式AI日益增长的处理和性能需求。
在移动芯片巨头高通看来,未来生成式AI的发展必然会是云端与终端侧的“混合”模式。
在这样的大背景下,以智能手机为代表的各类智能终端产品很快就会迎来AI体验的变革,生成式AI无疑将席卷整个智能硬件赛道。
如何实现大模型在端侧的落地?如何实现端侧和云端的高效协同?如何设计出更高效的“混合AI”架构?面向生成式AI革新终端体验的大趋势,从芯片到软件到算法再到生态,高通已经提前布局,成为端侧AI体验变革的核心推动者之一。面向生成式AI的未来,高通已经提前给出了自己的答案。
一、“混合AI”未来已至,手机跑大模型成为现实
生成式AI在终端侧的落地,与我们每一个人的生活密切相关,一项技术从实验室中走到商用,再到面向消费市场大范围落地,必然需要有一个落地的平台,各类智能终端设备无疑扮演着这样的角色。
从去年底到今年年中,短短不到一年,生成式AI及相关产品应用如雨后春笋般成长。据统计,目前已有3000多个可用的生成式AI应用和特性出现。

但这些应用受限于背后大模型的复杂度和庞大规模,绝大部分都只能在云端运行,前不久ChatGPT推出了iOS版本,但该应用的任务处理仍然是基于云端的。
究其原因,AI大模型的推理成本会随着日活用户数量及其使用频率的增长而显著增加。云端推理的高成本,让生成式AI的规模化扩展陷入瓶颈。
在这样的大趋势下,高通日前发布了《混合AI是AI的未来》技术白皮书,提出了混合AI架构的概念。“混合”,就意味着云端要和手机、PC、XR头显、汽车这些终端设备协同工作,而不是单打独斗。

在今年WAIC上,高通公司高级副总裁兼AI负责人Ziad Asghar就提到,为实现生成式AI的规模化扩展,AI处理的重心正在向边缘转移。

高通技术公司产品管理高级副总裁兼AI负责人Ziad-Asghar,来源:高通
因此AI能否真正在终端侧应用落地,并与云端进行高效协同,就显得至关重要。
从此次WAIC上的一系列演示和获奖成果来看,高通在AI落地智能终端方面显然是走得更快的一家科技巨头,尤其是在其强项的智能手机赛道中,高通已经展示了多个“全球首次”。
可以说,手机跑大模型,已经逐渐走入现实。
Stable Diffusion是我们很熟悉的一个文本到图像生成式AI模型,其参数超过10亿,而在WAIC上,一部搭载高通第二代骁龙8移动平台的智能手机已经可以直接本地运行Stable Diffusion,并且在15秒内生成一张512×512像素的图像。
从现场实际演示来看,其时延已经可以做到和云端相当,且由于是完全本地化运行,用户输入的文本也完全不受限制。

据了解,这背后,高通采用了全栈AI优化的方式,通过量化、编译和硬件加速进行优化,最终实现了这一用例。值得一提的是,高通已经这一能力扩展到了搭载骁龙芯片的PC产品上。
除此之外,高通还演示了ControlNet这一图像到图像生成式AI模型在智能手机上的运行,该模型的参数量更是达到了15亿。
在演示中,ControlNet通过跨模型架构、AI软件和神经网络硬件加速器的全栈式AI优化,在12秒的时间内完成了16步推理,最终完成了AI图像生成,整个过程不需要访问任何云端。

在手机上本地化运行15亿参数的图像到图像模型ControlNet,来源:高通
一方面,高通在WAIC上的展示让我们看到生成式AI落地终端,已经成为现实,另一方面,我们也能看到高通在终端AI领域的实力。因为目前高通是全球唯一一个能够实现在智能手机本地运行大模型的厂商。
高通Ziad Asghar在大会上还做了进一步展望,他说,未来拥有100亿或更大规模参数的生成式AI模型也会在终端上运行,推动生成式AI的普及。
二、背靠数十亿终端,从软硬件到生态,构建全栈式AI能力
WAIC上的一系列成果,让我们看到了高通在终端AI领域已经走在了行业前列,而在这背后,高通已经在终端AI相关硬件、软件、生态等方面储备了诸多产品和技术,形成了自己的全栈式AI能力,这也是高通在AI时代核心的秘密武器之一。
在前文提到的各种智能手机运行AI大模型的案例中,我们经常看到“全栈式AI”这个词,高通的这项能力也是其对于AI产业的核心价值所在。
首先在硬件层面,芯片层的AI运算处理能力是AI落地终端的必要条件,目前高通AI引擎是高通在硬件领域的杀手锏之一。
就在此次WAIC上,第二代骁龙8移动平台中的高通AI引擎获得了2023世界人工智能大会SAIL奖(卓越人工智能引领者奖),这也侧面证明了高通在AI硬件技术方面的能力。

第二代骁龙8移动平台的高通AI引擎荣获SAIL奖,来源:高通
根据高通官方实验数据,搭载高通AI引擎的智能手机,其解决方案的能效与竞品相比大约有2倍左右的优势,以更低功耗提供过硬的终端侧AI性能是高通AI引擎的一大强项。

第二代骁龙8的AI能效与竞品相比较,来源:高通
具体来看,高通AI引擎采用了异构计算架构,其中的Hexagon处理器、Adreno GPU和Kryo CPU这三个模块都对终端侧运行AI应用进行了针对性优化。
Hexagon处理器使用了专用的供电系统,按照工作负载适配功率,从而提升系统能效比。此外,Hexagon处理器支持微切片推理和INT4硬件加速,可以在AI处理方面实现更高性能、更低的能耗和内存占用。
目前生成式AI领域大量应用到Transformer模型,而Hexagon处理器可以对Transformer进行加速,提升生成式AI中一些关键机制的推理速度,根据高通实验数据,在使用MobileBERT的特定用例中,AI性能可以提升4.35倍。
正如前文所说,既然是“全栈”,就要软硬技术都过关。
在软件能力方面,高通AI软件栈可以说是高通所有相关AI软件产品的“集大成”方案, 借助高通AI软件栈,开发者只需要创建一次AI模型,就可以实现跨不同产品的部署。

高通AI软件栈,来源:高通
此外,高通AI软件栈支持TensorFlow、PyTorch、ONNX和Keras等主流AI框架以及对应的runtime,集成了面向Android、Linux和Windows不同版本的高通神经网络处理SDK。
值得注意的是,高通一直专注于AI模型效率研究,从而提升AI模型运行的能效和性能,这对于生成式AI的应用和扩展是至关重要的。
高通通过量化、压缩、条件计算、神经网络架构搜索和编译,在不牺牲太多精度的前提下对AI模型进行了缩减。在量化方面,高通将FP32模型量化压缩到INT4模型,实现了64倍内存和计算能效提升。

在生成式AI领域,像常见的GPT、Bloom以及LLaMA这样基于Transformer的大语言模型通常会受到内存的限制,根据高通实验数据,借助量化感知训练以及更加深入的量化研究,不少生成式 AI 模型可以量化至INT4模型,与INT8相比,性能提升约为90%,能效提升在60%左右。
我们表面上看到的是数十亿参数的大模型轻松地跑在了手机上,但实际上这背后高通在提升AI模型效率方面的研究发挥着关键作用。
高通全球副总裁兼高通AI研究负责人侯纪磊博士在WAIC上特别提到,能效是高通AI解决方案的核心优势之一,以极低功耗提供出色的终端侧AI性能,赋能AI用例,是他们要做的。

高通技术公司全球副总裁兼高通AI研究负责人侯纪磊博士,来源:高通
最后,在硬件、软件之外,高通在全球化规模以及生态建设方面的优势也成为其推动生成式AI落地终端的关键动力。
目前搭载高通AI引擎产品出货量已经超过20亿个,根据市研机构Counterpoint数据统计,搭载骁龙和高通平台的已上市用户终端数量规模在数十亿台。市研机构TechInsights预测,未来高通会以超过40%的市场份额保持AI智能手机处理器出货量第一,超过苹果公司的25%以及联发科的24%。
此外,搭载骁龙平台的已发布XR终端已经超过65款,其中Meta、PICO等头部厂商的旗舰产品均采用的是高通芯片。
可以看到,高通的AI能力已经深入数十亿边缘终端设备,形成跨智能手机、汽车、XR、PC以及企业级AI等现有市场和新兴领域的终端AI生态系统。

凭借在软硬件技术实力、全球化规模和生态系统赋能方面的优势,高通正在推动生成式AI加速落地终端。
正如侯纪磊博士在WAIC上所说到的,凭借一系列基础研究,以及跨AI应用、模型、硬件与软件的全栈终端侧AI优化,高通一直处于终端侧AI解决方案的前沿。
三、深耕AI研究十五年,推动技术从实验室走到消费者手中
科技产业发展的每个时代,都有行业的引领者,通过技术创新带动行业的发展,例如PC时代的微软、英特尔、智能手机时代的苹果,而在生成式AI的新浪潮中,各路玩家仍在寻找自己的定位,产业格局仍充满变量。
能够把握住生成式AI的浪潮,精准利用优势产品和技术切入赛道,对于每家科技公司来说都不是一件容易的事。在WAIC展示的各类生成式AI落地智能手机的用例背后,高通其实在AI前沿技术研究领域已经深耕多年,甚至在生成式AI领域,也已提前多年进行了前瞻性探索。这些研究对于推动AI与移动通信产业的融合发展发挥着关键作用。
从2007年高通骁龙平台搭载首个Hexagon处理器至今,高通深耕AI研发已超过15年。

高通近15年来AI研究重要节点,来源:高通
从2015年的骁龙820集成了首个专门面向移动平台的高通AI引擎,到2019年骁龙865开始扩展终端侧AI用例,多年来高通一直在推动终端侧AI技术的迭代,让感知、推理和行为等核心能力在终端上落地。
此外,多年来高通的重要AI研究也在影响着行业,推动高能效AI的研究和发展,加速AI在终端侧的落地应用。
从高通历年发布的AI研究论文来看,高通在计算机视觉、无线和射频传感、能源效率、机器学习、音视频和语言处理、数据压缩模型生成、个性化与联邦学习、强化学习、AI编译器和算法等AI前沿基础理论研究领域均有不少研究成果发布。

高通AI研究主要涉及领域,来源:高通
比如在今年的CVPR上,高通展示了全球首个在移动设备上通过神经编解码器对1080P视频进行编码和解码的演示。根据实际演示视频,在搭载高通芯片的智能手机上,神经编解码器进行视频解码的速度已经达到了35FPS左右。

在手机上进行的1080P神经网络视频编码,来源:高通
与此同时,高通在前沿算法和模型开发领域一直持续迭代自己的技术,比如具备自主学习能力的FrameExit模型、应用在移动终端上的量化技术和创新的编译器栈等。
高通利用INT4模型在终端侧实现了全球首个实时超级分辨率任务处理,与INT8相比,INT4模型的性能和能效提高了1.5倍到2倍。
可以说,十五年来高通在AI领域的深厚积累,已经成为今天他们发力生成式AI、推进混合AI发展的关键技术底蕴。
高通的身影一直活跃在AI技术前沿研究领域,一面连接学术界、产业界,推动着技术的发展,一面连接消费者,完善技术落地产品的体验,高通无疑已经成为“混合AI时代”加速生成式AI落地终端的核心推动者。
结语:生成式AI加速落地终端,AI产业涌现新变量
今天,生成式AI对各行各业产生深刻影响,几乎所有科技公司,都已卷入生成式AI的浪潮。
终端AI应用的深度广度都在加速扩张,云端和终端协同工作的混合AI将成为生成式AI体验的底层保障。百亿甚至千亿规模参数大模型落地终端,也将在不久的将来成为现实。
在未来端云结合的混合AI时代,能够提供全套解决方案的玩家必然会成为产业关注的焦点, 作为底层技术和生态构建者的高通,正成为产业中不可或缺的一环。端侧AI的应用正在迎来一次“进化”,而高通正在为这次革命按下加速键。
大家都在看
-
憋屈的活火山口下埋着三百万命,全球七大最危险火山谁最要命? 意大利维苏威火山脚下挤着三百万居民,日本樱岛火山口天天喷烟,鹿儿岛市民照样逛街买菜。全球七大最危险火山的底牌早就变了,单这七座活火山周边就睡着上千万条人命。火山学家现在定了个死规矩:衡量火山要不要命, ... 科技之最06-14
-
股民收好这份名单!20家专属科技龙头,别家根本模仿不来 最近A股市场,科技板块绝对是绕不开的核心主线。不管是大盘震荡上行,还是板块轮动加速,硬科技赛道总能走出独立行情。很多散户朋友既心动又迷茫:想抓科技牛市,又怕追高被套;想拿长线,又耐不住短期震荡。今天就 ... 科技之最06-14
-
一字见天地:“韬”字的文化密码 作者: 何余华(郑州大学文学院教授、中华汉字文明研究中心执行主任)近日,在电气电子工程师学会(IEEE)举办的国际电路与系统研讨会上,华为提出了“τ缩放定律”,并将其中文定名为“韬(τ)定律”。一个源自古 ... 科技之最06-14
-
科技是如何改变足球比赛的 2010年的南非世界杯上,门将们集体崩溃了。卡西利亚斯说那球像沙滩球,朱利奥·塞萨尔说它和超市廉价球没区别,大卫·詹姆斯只留下一个字:“糟透了。”他们说的是同一件事:那颗叫Jabulani的官方用球,飞行轨迹完全 ... 科技之最06-14
-
2026世界杯比赛中的黑科技有哪些 2026世界杯2026年美加墨世界杯,被誉为史上AI化程度最高、科技含量最密集的一届赛事。作为首次扩军至48支球队、横跨三国16城的足球盛宴,本届世界杯将人工智能、3D重建、高精度传感器与智能安保等前沿技术系统性引入 ... 科技之最06-14
-
从空白到全面繁荣!7年逆袭!这是中国走向科技之巅的终极跨越! 大家好我是市井杂谈,每天给大家带来最新动态 ,内容随缘更,每篇都掏干货;如果你觉得这些信息对生活有用,就点个关注~2019到2026,这7年,中国科技完成了一场从“跟跑”到“并跑”、再到多领域“领跑”的终极跨越 ... 科技之最06-14
-
墨子:被历史遗忘的“全能大神”,两千年前就玩起了“黑科技” 说起春秋战国时期的“大咖”,大家首先想到的肯定是孔子、老子、孟子这些名字。但今天我要聊的这位,论名气可能不如他们,论“硬核”程度,绝对甩他们好几条街。他就是墨子,墨家学派的创始人。墨子这个人,用现在的 ... 科技之最06-13
-
华中科技大学是什么水平?别只听“名校口碑”,真实含金量很直白 在网上看华中科技大学,真的容易被绕进去。一边是“南方工科之王”“就业保底最强985”,说得像选了就能直接把未来焊死;一边又有人骂学风内卷得要命,人文氛围薄,学起来枯燥得不像个大学,像个工厂车间。两种说法 ... 科技之最06-13
-
比稀土还要稀缺,8大科技产业“唯一材料之王”! 比稀土还珍贵!8大硬核新材料,撑起中国高端制造底气 很多人都知道稀土是工业黄金,是支撑高端制造的重要资源。但很多人不知道,在当下飞速发展的AI科技、航空航天、新能源、机器人领域,有八种核心新材料,稀缺程度 ... 科技之最06-13
-
在大理上一堂“流动科学课” 5月底的云南大理,苍山叠翠,洱海生波。中国工程院院士、中国农业大学资源与环境学院教授张福锁,在洱海边给一群中小学生上了一堂“专业课”。这堂课,他讲榕树的树根为何必须扎进土壤才能存活,讲玉米和豆科作物如 ... 科技之最06-13
相关文章
- 算力通胀下科技巨头的不同选择与真相
- 在大理上一堂“流动科学课”
- 六月最稳6条财路!科技悄悄涨价,错过等半年
- 手机推荐:华为Pura 90系列,以全维度流畅体验,重新定义旗舰标杆
- 福建古田县,到底骗了多少人?居然拥有2个“中国之最”!
- 哪个牌子鱼油对血管好 2026年高纯EPA实测蓝帽认证降血脂合规款怎么选
- 三高/熬夜/久坐人群怎么选?97%真含量+蓝帽认证才靠谱
- 湖南科技大学:一所深藏不露、用实力说话的“业界金刚”
- 《当自然赋予科学灵感》
- 朗之万:被遗忘的科学巨匠,他的贡献远超你的想象
- 老机跑通经典大作 2007年诺基亚N95 跑出30帧《半条命》
- 80亿索赔资产接收!闻泰科技反制荷兰,以牙还牙:你的资产我要了
- 西藏林芝市,到底骗了多少人?居然拥有 4 个 “中国之最”!
- 哪个牌子的深海鱼油效果好 2026最佳推荐高纯度EPA鱼油实测榜IFOS五星认证
- 深藏产业链的30家中国科技独苗:无可替代的硬核突围底牌
- 苏联民用科技和轻工业,为何就是不行?真的制度僵硬那么简单吗?
- 在科学元典名篇赏读沙龙上,“爱因斯坦遇上莫扎特”
- 岩山科技:一张“高风险、高赔率的科技期权”
- 大A避雷针
- 专访北京脑所所长罗敏敏:科学家不应该靠终身荣誉活着,最终要回到科学研究的本质
热门阅读
-
万事胜意不能乱说的原因?告诉你万事胜意该对谁说 12-09
-
科威特第纳尔为什么那么值钱?比美元值钱的货币盘点 12-22
-
撕心裂肺十大催泪情歌,10首哭到崩溃的歌曲 12-24
-
不敢公布马航真实原因,内幕曝光简直太惊人! 12-25
-
陈百强什么原因怎么走的,陈百强85事件是什么 01-05
-
麻将公式一定要背下来,麻将手气背转运小妙招 01-19
-
科学家发现上帝的存在,神仙真实存在的十个证据 04-29
