刷屏WAIC,加速生成式AI落地终端,高通亮出诸多“黑科技”

智东西
作者 | 云鹏
编辑 | 漠影
今年科技圈最火热的话题,非生成式AI莫属,而生成式AI发展迭代的速度之快,也令人惊叹。
从GPT-3.5到GPT-4.0,从多模态交互融入到插件的支持,而曾经只能跑在云端的AI大模型,也开始在智能终端设备中落地。
没错,今天拥有数十亿、上百亿参数的AI大模型已经可以直接在你的手机上运行了。注意,是完全本地化运行,只依赖手机本身的算力。
这听起来似乎还有些遥远,但就在上周召开的上海WAIC上,我们已经看到搭载高通第二代骁龙8芯片的安卓手机直接运行参数规模超过10亿的Stable Diffusion,且只需要15秒左右就可以出图,而参数规模超过15亿的ControlNet也成功在手机终端上实现了本地化运行。

搭载骁龙芯片的手机运行Stable Diffusion,15秒左右出图,来源:高通
在WAIC上,我们还能看到各类生成式AI应用已经可以被越来越多的普通消费者通过身边的智能设备接触到。
AI正迎来大爆发时期,就像此前电视、互联网和智能手机的问世,而这种爆发对算力以及计算架构都提出了新的需求。AI训练和推理的成本显著提升,计算架构需要不断演进并满足生成式AI日益增长的处理和性能需求。
在移动芯片巨头高通看来,未来生成式AI的发展必然会是云端与终端侧的“混合”模式。
在这样的大背景下,以智能手机为代表的各类智能终端产品很快就会迎来AI体验的变革,生成式AI无疑将席卷整个智能硬件赛道。
如何实现大模型在端侧的落地?如何实现端侧和云端的高效协同?如何设计出更高效的“混合AI”架构?面向生成式AI革新终端体验的大趋势,从芯片到软件到算法再到生态,高通已经提前布局,成为端侧AI体验变革的核心推动者之一。面向生成式AI的未来,高通已经提前给出了自己的答案。
一、“混合AI”未来已至,手机跑大模型成为现实
生成式AI在终端侧的落地,与我们每一个人的生活密切相关,一项技术从实验室中走到商用,再到面向消费市场大范围落地,必然需要有一个落地的平台,各类智能终端设备无疑扮演着这样的角色。
从去年底到今年年中,短短不到一年,生成式AI及相关产品应用如雨后春笋般成长。据统计,目前已有3000多个可用的生成式AI应用和特性出现。

但这些应用受限于背后大模型的复杂度和庞大规模,绝大部分都只能在云端运行,前不久ChatGPT推出了iOS版本,但该应用的任务处理仍然是基于云端的。
究其原因,AI大模型的推理成本会随着日活用户数量及其使用频率的增长而显著增加。云端推理的高成本,让生成式AI的规模化扩展陷入瓶颈。
在这样的大趋势下,高通日前发布了《混合AI是AI的未来》技术白皮书,提出了混合AI架构的概念。“混合”,就意味着云端要和手机、PC、XR头显、汽车这些终端设备协同工作,而不是单打独斗。

在今年WAIC上,高通公司高级副总裁兼AI负责人Ziad Asghar就提到,为实现生成式AI的规模化扩展,AI处理的重心正在向边缘转移。

高通技术公司产品管理高级副总裁兼AI负责人Ziad-Asghar,来源:高通
因此AI能否真正在终端侧应用落地,并与云端进行高效协同,就显得至关重要。
从此次WAIC上的一系列演示和获奖成果来看,高通在AI落地智能终端方面显然是走得更快的一家科技巨头,尤其是在其强项的智能手机赛道中,高通已经展示了多个“全球首次”。
可以说,手机跑大模型,已经逐渐走入现实。
Stable Diffusion是我们很熟悉的一个文本到图像生成式AI模型,其参数超过10亿,而在WAIC上,一部搭载高通第二代骁龙8移动平台的智能手机已经可以直接本地运行Stable Diffusion,并且在15秒内生成一张512×512像素的图像。
从现场实际演示来看,其时延已经可以做到和云端相当,且由于是完全本地化运行,用户输入的文本也完全不受限制。

据了解,这背后,高通采用了全栈AI优化的方式,通过量化、编译和硬件加速进行优化,最终实现了这一用例。值得一提的是,高通已经这一能力扩展到了搭载骁龙芯片的PC产品上。
除此之外,高通还演示了ControlNet这一图像到图像生成式AI模型在智能手机上的运行,该模型的参数量更是达到了15亿。
在演示中,ControlNet通过跨模型架构、AI软件和神经网络硬件加速器的全栈式AI优化,在12秒的时间内完成了16步推理,最终完成了AI图像生成,整个过程不需要访问任何云端。

在手机上本地化运行15亿参数的图像到图像模型ControlNet,来源:高通
一方面,高通在WAIC上的展示让我们看到生成式AI落地终端,已经成为现实,另一方面,我们也能看到高通在终端AI领域的实力。因为目前高通是全球唯一一个能够实现在智能手机本地运行大模型的厂商。
高通Ziad Asghar在大会上还做了进一步展望,他说,未来拥有100亿或更大规模参数的生成式AI模型也会在终端上运行,推动生成式AI的普及。
二、背靠数十亿终端,从软硬件到生态,构建全栈式AI能力
WAIC上的一系列成果,让我们看到了高通在终端AI领域已经走在了行业前列,而在这背后,高通已经在终端AI相关硬件、软件、生态等方面储备了诸多产品和技术,形成了自己的全栈式AI能力,这也是高通在AI时代核心的秘密武器之一。
在前文提到的各种智能手机运行AI大模型的案例中,我们经常看到“全栈式AI”这个词,高通的这项能力也是其对于AI产业的核心价值所在。
首先在硬件层面,芯片层的AI运算处理能力是AI落地终端的必要条件,目前高通AI引擎是高通在硬件领域的杀手锏之一。
就在此次WAIC上,第二代骁龙8移动平台中的高通AI引擎获得了2023世界人工智能大会SAIL奖(卓越人工智能引领者奖),这也侧面证明了高通在AI硬件技术方面的能力。

第二代骁龙8移动平台的高通AI引擎荣获SAIL奖,来源:高通
根据高通官方实验数据,搭载高通AI引擎的智能手机,其解决方案的能效与竞品相比大约有2倍左右的优势,以更低功耗提供过硬的终端侧AI性能是高通AI引擎的一大强项。

第二代骁龙8的AI能效与竞品相比较,来源:高通
具体来看,高通AI引擎采用了异构计算架构,其中的Hexagon处理器、Adreno GPU和Kryo CPU这三个模块都对终端侧运行AI应用进行了针对性优化。
Hexagon处理器使用了专用的供电系统,按照工作负载适配功率,从而提升系统能效比。此外,Hexagon处理器支持微切片推理和INT4硬件加速,可以在AI处理方面实现更高性能、更低的能耗和内存占用。
目前生成式AI领域大量应用到Transformer模型,而Hexagon处理器可以对Transformer进行加速,提升生成式AI中一些关键机制的推理速度,根据高通实验数据,在使用MobileBERT的特定用例中,AI性能可以提升4.35倍。
正如前文所说,既然是“全栈”,就要软硬技术都过关。
在软件能力方面,高通AI软件栈可以说是高通所有相关AI软件产品的“集大成”方案, 借助高通AI软件栈,开发者只需要创建一次AI模型,就可以实现跨不同产品的部署。

高通AI软件栈,来源:高通
此外,高通AI软件栈支持TensorFlow、PyTorch、ONNX和Keras等主流AI框架以及对应的runtime,集成了面向Android、Linux和Windows不同版本的高通神经网络处理SDK。
值得注意的是,高通一直专注于AI模型效率研究,从而提升AI模型运行的能效和性能,这对于生成式AI的应用和扩展是至关重要的。
高通通过量化、压缩、条件计算、神经网络架构搜索和编译,在不牺牲太多精度的前提下对AI模型进行了缩减。在量化方面,高通将FP32模型量化压缩到INT4模型,实现了64倍内存和计算能效提升。

在生成式AI领域,像常见的GPT、Bloom以及LLaMA这样基于Transformer的大语言模型通常会受到内存的限制,根据高通实验数据,借助量化感知训练以及更加深入的量化研究,不少生成式 AI 模型可以量化至INT4模型,与INT8相比,性能提升约为90%,能效提升在60%左右。
我们表面上看到的是数十亿参数的大模型轻松地跑在了手机上,但实际上这背后高通在提升AI模型效率方面的研究发挥着关键作用。
高通全球副总裁兼高通AI研究负责人侯纪磊博士在WAIC上特别提到,能效是高通AI解决方案的核心优势之一,以极低功耗提供出色的终端侧AI性能,赋能AI用例,是他们要做的。

高通技术公司全球副总裁兼高通AI研究负责人侯纪磊博士,来源:高通
最后,在硬件、软件之外,高通在全球化规模以及生态建设方面的优势也成为其推动生成式AI落地终端的关键动力。
目前搭载高通AI引擎产品出货量已经超过20亿个,根据市研机构Counterpoint数据统计,搭载骁龙和高通平台的已上市用户终端数量规模在数十亿台。市研机构TechInsights预测,未来高通会以超过40%的市场份额保持AI智能手机处理器出货量第一,超过苹果公司的25%以及联发科的24%。
此外,搭载骁龙平台的已发布XR终端已经超过65款,其中Meta、PICO等头部厂商的旗舰产品均采用的是高通芯片。
可以看到,高通的AI能力已经深入数十亿边缘终端设备,形成跨智能手机、汽车、XR、PC以及企业级AI等现有市场和新兴领域的终端AI生态系统。

凭借在软硬件技术实力、全球化规模和生态系统赋能方面的优势,高通正在推动生成式AI加速落地终端。
正如侯纪磊博士在WAIC上所说到的,凭借一系列基础研究,以及跨AI应用、模型、硬件与软件的全栈终端侧AI优化,高通一直处于终端侧AI解决方案的前沿。
三、深耕AI研究十五年,推动技术从实验室走到消费者手中
科技产业发展的每个时代,都有行业的引领者,通过技术创新带动行业的发展,例如PC时代的微软、英特尔、智能手机时代的苹果,而在生成式AI的新浪潮中,各路玩家仍在寻找自己的定位,产业格局仍充满变量。
能够把握住生成式AI的浪潮,精准利用优势产品和技术切入赛道,对于每家科技公司来说都不是一件容易的事。在WAIC展示的各类生成式AI落地智能手机的用例背后,高通其实在AI前沿技术研究领域已经深耕多年,甚至在生成式AI领域,也已提前多年进行了前瞻性探索。这些研究对于推动AI与移动通信产业的融合发展发挥着关键作用。
从2007年高通骁龙平台搭载首个Hexagon处理器至今,高通深耕AI研发已超过15年。

高通近15年来AI研究重要节点,来源:高通
从2015年的骁龙820集成了首个专门面向移动平台的高通AI引擎,到2019年骁龙865开始扩展终端侧AI用例,多年来高通一直在推动终端侧AI技术的迭代,让感知、推理和行为等核心能力在终端上落地。
此外,多年来高通的重要AI研究也在影响着行业,推动高能效AI的研究和发展,加速AI在终端侧的落地应用。
从高通历年发布的AI研究论文来看,高通在计算机视觉、无线和射频传感、能源效率、机器学习、音视频和语言处理、数据压缩模型生成、个性化与联邦学习、强化学习、AI编译器和算法等AI前沿基础理论研究领域均有不少研究成果发布。

高通AI研究主要涉及领域,来源:高通
比如在今年的CVPR上,高通展示了全球首个在移动设备上通过神经编解码器对1080P视频进行编码和解码的演示。根据实际演示视频,在搭载高通芯片的智能手机上,神经编解码器进行视频解码的速度已经达到了35FPS左右。

在手机上进行的1080P神经网络视频编码,来源:高通
与此同时,高通在前沿算法和模型开发领域一直持续迭代自己的技术,比如具备自主学习能力的FrameExit模型、应用在移动终端上的量化技术和创新的编译器栈等。
高通利用INT4模型在终端侧实现了全球首个实时超级分辨率任务处理,与INT8相比,INT4模型的性能和能效提高了1.5倍到2倍。
可以说,十五年来高通在AI领域的深厚积累,已经成为今天他们发力生成式AI、推进混合AI发展的关键技术底蕴。
高通的身影一直活跃在AI技术前沿研究领域,一面连接学术界、产业界,推动着技术的发展,一面连接消费者,完善技术落地产品的体验,高通无疑已经成为“混合AI时代”加速生成式AI落地终端的核心推动者。
结语:生成式AI加速落地终端,AI产业涌现新变量
今天,生成式AI对各行各业产生深刻影响,几乎所有科技公司,都已卷入生成式AI的浪潮。
终端AI应用的深度广度都在加速扩张,云端和终端协同工作的混合AI将成为生成式AI体验的底层保障。百亿甚至千亿规模参数大模型落地终端,也将在不久的将来成为现实。
在未来端云结合的混合AI时代,能够提供全套解决方案的玩家必然会成为产业关注的焦点, 作为底层技术和生态构建者的高通,正成为产业中不可或缺的一环。端侧AI的应用正在迎来一次“进化”,而高通正在为这次革命按下加速键。
大家都在看
-
2399元起!「性能旗舰新选择」一加 Ace 6T发布:同档找不到对手 2025 年 12 月 3 日,一加在杭州萧山瓜沥文化体育中心正式发布「性能旗舰新选择」一加 Ace 6T。雷科技受邀到现场参与报道。图源:一加外观方面,一加 Ace 6T 搭载了一块 6.83 英寸的 OLED 直屏,机身背部用的是「金 ... 科技之最12-05
-
13亿欧元的败笔:科学史上最昂贵的实验 史上最昂贵的科学实验:为什么我们造不出“大脑”?2013 年,欧洲科学界发生了一件大事。一位极具个人魅力的神经科学家亨利·马克拉姆(Henry Markram),站在了 TED 的舞台中央。他向全世界许下了一个宏愿:给我 10 ... 科技之最12-05
-
华为日照金山路由器评测:路由器有颜了,对得起1299元的价格 日前,华为发布了一款备受关注的路由器产品:华为日照金山路由器。作为可能是市面上最好看的路由器,雷科技编辑部小伙伴们对这款产品十分感兴趣,要知道,在这款产品出现前,几乎没人关心过路由器的颜值。那么,除了 ... 科技之最12-05
-
口出狂言?初代网红罗永浩:我不会被限流,除非我「死」了 12 月 2 日消息,今天微博上有个网友提出疑问:罗永浩为什么能长盛不衰?罗永浩本人转发表示:只有死亡才能构成真正有效的限流。图源:微博截图嚯,老罗对自己的“流量体质”真有信心。话说回来,今天都周二了,答应 ... 科技之最12-05
-
CES官方剧透来了!AI成“绝对焦点”,AI硬件成全场主角 将于 2026 年 1 月 6 日到 9 日于美国拉斯维加斯举行的CES2026,已进入倒计时阶段。从 1967 年创办至今,历经近 60 年的 CES(Consumer Electronics Show,国际消费类电子产品展览会),早已成为全球消费电子行业的 ... 科技之最12-05
-
华为Mate 80 实测称王:无惧户外强光,中国屏亮天下 文/柳华芳 「科技先生」出品没有线下发布会,11月25日线上发布,华为Mate 80系列依旧做到了门店火爆、一机难求。过目不忘的双环设计、超透亮灵珑屏、户外探索模式......从设计上的光环之王,到惊叹的技术创新,每一 ... 科技之最12-05
-
火药味十足!荣耀高管犀利点评豆包手机:并不看好,撑不过三代 12 月 4 日消息,日前字节发布了豆包手机,现已售罄。价格 3499 元,搭载骁龙 8 至尊版处理器,有三颗 5000 万像素的摄像头。豆包手机在二手市场的售价最高已被炒至 7999 元。图源:豆包官网小雷从演示视频看到,用 ... 科技之最12-05
-
下周,科技板块最受投资者关注! 对于下周A股市场的潜力板块和方向选择,科技板块看好比例大幅提升。本周(11月24日至28日),A股市场震荡走高,成交规模维持在1.5万亿元上方。指数方面,上证指数本周上涨1.4%,最新报3888.60点;深证成指上涨3.56% ... 科技之最12-01
-
中国基建再出王炸,香山大桥创下3项世界之最,老外直呼不可能 没有惊天动地的宣传,一座横跨海湾的超级大桥悄然刷新世界纪录——香山大桥,这座中国基建的新标杆,用3项全球首创技术,在波涛之上架起“海上长虹”,让世界看见中国工程的硬核实力!今天就带大家解锁这座大桥的传 ... 科技之最11-30
-
科技前线 微观世界中,电子具有“自旋”的基本属性,这些“自旋”如同一个个微小磁针。材料的较多宏观特性,如磁铁的磁性或超导体的零电阻,皆源于这些微观磁针的排列方式与相互作用。日前,中国科学技术大学与浙江大学合作, ... 科技之最11-30
相关文章
- 为什么要强化科学研究、技术开发原始创新导向
- 中国基建再出王炸,香山大桥创下3项世界之最,老外直呼不可能
- 科技前线
- “开路小工”,科技强国大有作为!
- 红色地标上新+2!快来预约吧!
- “欧拉:数学界的天才魔术师,开启科学黄金时代的奇幻之旅”
- 标题:他洗澡发现浮力用杠杆放言撬动地球!阿基米德“科学狂人”
- 武汉进入全球前10强!打造5大高科技之谷!冲刺国家中心城市!
- 他用一粒苹果,撬动整个宇宙一一牛顿,科学王座上的孤独巨人
- 3999元!夸克S1首发评测:一款眼镜装下了淘宝、高德和支付宝
- 与鸿蒙共赴星光之约:当科技成为生活中最贴心的队友
- 年销量或破400万!智能戒指起风了,国产厂商这波却输得很惨
- 「微光力量」让科技更有温度!用脑机接口解码生命信号,强脑科技推动科技助残走向普惠
- 新国标要来了!充电宝要涨价?好消息是能用更多年了
- 被忽视的科技之光:这些中国技术正在重塑你的日常生活
- 时隔两年的回归:骁龙8 Gen 5到底变了什么?
- 蔡司,凭什么打造出“上帝之眼”?
- Gemini+TPU双线破局!顶级科技投资人“火上浇油”:七巨头中Alphabet最值得持有
- AI硬件先驱要成先烈了!Rabbit到底做错了什么?
- 赛场内外处处彰显科技范儿,从全运会看中国创新
热门阅读
-
万事胜意不能乱说的原因?告诉你万事胜意该对谁说 12-09
-
科威特第纳尔为什么那么值钱?比美元值钱的货币盘点 12-22
-
撕心裂肺十大催泪情歌,10首哭到崩溃的歌曲 12-24
-
不敢公布马航真实原因,内幕曝光简直太惊人! 12-25
-
陈百强什么原因怎么走的,陈百强85事件是什么 01-05
-
麻将公式一定要背下来,麻将手气背转运小妙招 01-19
