刷屏WAIC,加速生成式AI落地终端,高通亮出诸多“黑科技”

智东西
作者 | 云鹏
编辑 | 漠影
今年科技圈最火热的话题,非生成式AI莫属,而生成式AI发展迭代的速度之快,也令人惊叹。
从GPT-3.5到GPT-4.0,从多模态交互融入到插件的支持,而曾经只能跑在云端的AI大模型,也开始在智能终端设备中落地。
没错,今天拥有数十亿、上百亿参数的AI大模型已经可以直接在你的手机上运行了。注意,是完全本地化运行,只依赖手机本身的算力。
这听起来似乎还有些遥远,但就在上周召开的上海WAIC上,我们已经看到搭载高通第二代骁龙8芯片的安卓手机直接运行参数规模超过10亿的Stable Diffusion,且只需要15秒左右就可以出图,而参数规模超过15亿的ControlNet也成功在手机终端上实现了本地化运行。

搭载骁龙芯片的手机运行Stable Diffusion,15秒左右出图,来源:高通
在WAIC上,我们还能看到各类生成式AI应用已经可以被越来越多的普通消费者通过身边的智能设备接触到。
AI正迎来大爆发时期,就像此前电视、互联网和智能手机的问世,而这种爆发对算力以及计算架构都提出了新的需求。AI训练和推理的成本显著提升,计算架构需要不断演进并满足生成式AI日益增长的处理和性能需求。
在移动芯片巨头高通看来,未来生成式AI的发展必然会是云端与终端侧的“混合”模式。
在这样的大背景下,以智能手机为代表的各类智能终端产品很快就会迎来AI体验的变革,生成式AI无疑将席卷整个智能硬件赛道。
如何实现大模型在端侧的落地?如何实现端侧和云端的高效协同?如何设计出更高效的“混合AI”架构?面向生成式AI革新终端体验的大趋势,从芯片到软件到算法再到生态,高通已经提前布局,成为端侧AI体验变革的核心推动者之一。面向生成式AI的未来,高通已经提前给出了自己的答案。
一、“混合AI”未来已至,手机跑大模型成为现实
生成式AI在终端侧的落地,与我们每一个人的生活密切相关,一项技术从实验室中走到商用,再到面向消费市场大范围落地,必然需要有一个落地的平台,各类智能终端设备无疑扮演着这样的角色。
从去年底到今年年中,短短不到一年,生成式AI及相关产品应用如雨后春笋般成长。据统计,目前已有3000多个可用的生成式AI应用和特性出现。

但这些应用受限于背后大模型的复杂度和庞大规模,绝大部分都只能在云端运行,前不久ChatGPT推出了iOS版本,但该应用的任务处理仍然是基于云端的。
究其原因,AI大模型的推理成本会随着日活用户数量及其使用频率的增长而显著增加。云端推理的高成本,让生成式AI的规模化扩展陷入瓶颈。
在这样的大趋势下,高通日前发布了《混合AI是AI的未来》技术白皮书,提出了混合AI架构的概念。“混合”,就意味着云端要和手机、PC、XR头显、汽车这些终端设备协同工作,而不是单打独斗。

在今年WAIC上,高通公司高级副总裁兼AI负责人Ziad Asghar就提到,为实现生成式AI的规模化扩展,AI处理的重心正在向边缘转移。

高通技术公司产品管理高级副总裁兼AI负责人Ziad-Asghar,来源:高通
因此AI能否真正在终端侧应用落地,并与云端进行高效协同,就显得至关重要。
从此次WAIC上的一系列演示和获奖成果来看,高通在AI落地智能终端方面显然是走得更快的一家科技巨头,尤其是在其强项的智能手机赛道中,高通已经展示了多个“全球首次”。
可以说,手机跑大模型,已经逐渐走入现实。
Stable Diffusion是我们很熟悉的一个文本到图像生成式AI模型,其参数超过10亿,而在WAIC上,一部搭载高通第二代骁龙8移动平台的智能手机已经可以直接本地运行Stable Diffusion,并且在15秒内生成一张512×512像素的图像。
从现场实际演示来看,其时延已经可以做到和云端相当,且由于是完全本地化运行,用户输入的文本也完全不受限制。

据了解,这背后,高通采用了全栈AI优化的方式,通过量化、编译和硬件加速进行优化,最终实现了这一用例。值得一提的是,高通已经这一能力扩展到了搭载骁龙芯片的PC产品上。
除此之外,高通还演示了ControlNet这一图像到图像生成式AI模型在智能手机上的运行,该模型的参数量更是达到了15亿。
在演示中,ControlNet通过跨模型架构、AI软件和神经网络硬件加速器的全栈式AI优化,在12秒的时间内完成了16步推理,最终完成了AI图像生成,整个过程不需要访问任何云端。

在手机上本地化运行15亿参数的图像到图像模型ControlNet,来源:高通
一方面,高通在WAIC上的展示让我们看到生成式AI落地终端,已经成为现实,另一方面,我们也能看到高通在终端AI领域的实力。因为目前高通是全球唯一一个能够实现在智能手机本地运行大模型的厂商。
高通Ziad Asghar在大会上还做了进一步展望,他说,未来拥有100亿或更大规模参数的生成式AI模型也会在终端上运行,推动生成式AI的普及。
二、背靠数十亿终端,从软硬件到生态,构建全栈式AI能力
WAIC上的一系列成果,让我们看到了高通在终端AI领域已经走在了行业前列,而在这背后,高通已经在终端AI相关硬件、软件、生态等方面储备了诸多产品和技术,形成了自己的全栈式AI能力,这也是高通在AI时代核心的秘密武器之一。
在前文提到的各种智能手机运行AI大模型的案例中,我们经常看到“全栈式AI”这个词,高通的这项能力也是其对于AI产业的核心价值所在。
首先在硬件层面,芯片层的AI运算处理能力是AI落地终端的必要条件,目前高通AI引擎是高通在硬件领域的杀手锏之一。
就在此次WAIC上,第二代骁龙8移动平台中的高通AI引擎获得了2023世界人工智能大会SAIL奖(卓越人工智能引领者奖),这也侧面证明了高通在AI硬件技术方面的能力。

第二代骁龙8移动平台的高通AI引擎荣获SAIL奖,来源:高通
根据高通官方实验数据,搭载高通AI引擎的智能手机,其解决方案的能效与竞品相比大约有2倍左右的优势,以更低功耗提供过硬的终端侧AI性能是高通AI引擎的一大强项。

第二代骁龙8的AI能效与竞品相比较,来源:高通
具体来看,高通AI引擎采用了异构计算架构,其中的Hexagon处理器、Adreno GPU和Kryo CPU这三个模块都对终端侧运行AI应用进行了针对性优化。
Hexagon处理器使用了专用的供电系统,按照工作负载适配功率,从而提升系统能效比。此外,Hexagon处理器支持微切片推理和INT4硬件加速,可以在AI处理方面实现更高性能、更低的能耗和内存占用。
目前生成式AI领域大量应用到Transformer模型,而Hexagon处理器可以对Transformer进行加速,提升生成式AI中一些关键机制的推理速度,根据高通实验数据,在使用MobileBERT的特定用例中,AI性能可以提升4.35倍。
正如前文所说,既然是“全栈”,就要软硬技术都过关。
在软件能力方面,高通AI软件栈可以说是高通所有相关AI软件产品的“集大成”方案, 借助高通AI软件栈,开发者只需要创建一次AI模型,就可以实现跨不同产品的部署。

高通AI软件栈,来源:高通
此外,高通AI软件栈支持TensorFlow、PyTorch、ONNX和Keras等主流AI框架以及对应的runtime,集成了面向Android、Linux和Windows不同版本的高通神经网络处理SDK。
值得注意的是,高通一直专注于AI模型效率研究,从而提升AI模型运行的能效和性能,这对于生成式AI的应用和扩展是至关重要的。
高通通过量化、压缩、条件计算、神经网络架构搜索和编译,在不牺牲太多精度的前提下对AI模型进行了缩减。在量化方面,高通将FP32模型量化压缩到INT4模型,实现了64倍内存和计算能效提升。

在生成式AI领域,像常见的GPT、Bloom以及LLaMA这样基于Transformer的大语言模型通常会受到内存的限制,根据高通实验数据,借助量化感知训练以及更加深入的量化研究,不少生成式 AI 模型可以量化至INT4模型,与INT8相比,性能提升约为90%,能效提升在60%左右。
我们表面上看到的是数十亿参数的大模型轻松地跑在了手机上,但实际上这背后高通在提升AI模型效率方面的研究发挥着关键作用。
高通全球副总裁兼高通AI研究负责人侯纪磊博士在WAIC上特别提到,能效是高通AI解决方案的核心优势之一,以极低功耗提供出色的终端侧AI性能,赋能AI用例,是他们要做的。

高通技术公司全球副总裁兼高通AI研究负责人侯纪磊博士,来源:高通
最后,在硬件、软件之外,高通在全球化规模以及生态建设方面的优势也成为其推动生成式AI落地终端的关键动力。
目前搭载高通AI引擎产品出货量已经超过20亿个,根据市研机构Counterpoint数据统计,搭载骁龙和高通平台的已上市用户终端数量规模在数十亿台。市研机构TechInsights预测,未来高通会以超过40%的市场份额保持AI智能手机处理器出货量第一,超过苹果公司的25%以及联发科的24%。
此外,搭载骁龙平台的已发布XR终端已经超过65款,其中Meta、PICO等头部厂商的旗舰产品均采用的是高通芯片。
可以看到,高通的AI能力已经深入数十亿边缘终端设备,形成跨智能手机、汽车、XR、PC以及企业级AI等现有市场和新兴领域的终端AI生态系统。

凭借在软硬件技术实力、全球化规模和生态系统赋能方面的优势,高通正在推动生成式AI加速落地终端。
正如侯纪磊博士在WAIC上所说到的,凭借一系列基础研究,以及跨AI应用、模型、硬件与软件的全栈终端侧AI优化,高通一直处于终端侧AI解决方案的前沿。
三、深耕AI研究十五年,推动技术从实验室走到消费者手中
科技产业发展的每个时代,都有行业的引领者,通过技术创新带动行业的发展,例如PC时代的微软、英特尔、智能手机时代的苹果,而在生成式AI的新浪潮中,各路玩家仍在寻找自己的定位,产业格局仍充满变量。
能够把握住生成式AI的浪潮,精准利用优势产品和技术切入赛道,对于每家科技公司来说都不是一件容易的事。在WAIC展示的各类生成式AI落地智能手机的用例背后,高通其实在AI前沿技术研究领域已经深耕多年,甚至在生成式AI领域,也已提前多年进行了前瞻性探索。这些研究对于推动AI与移动通信产业的融合发展发挥着关键作用。
从2007年高通骁龙平台搭载首个Hexagon处理器至今,高通深耕AI研发已超过15年。

高通近15年来AI研究重要节点,来源:高通
从2015年的骁龙820集成了首个专门面向移动平台的高通AI引擎,到2019年骁龙865开始扩展终端侧AI用例,多年来高通一直在推动终端侧AI技术的迭代,让感知、推理和行为等核心能力在终端上落地。
此外,多年来高通的重要AI研究也在影响着行业,推动高能效AI的研究和发展,加速AI在终端侧的落地应用。
从高通历年发布的AI研究论文来看,高通在计算机视觉、无线和射频传感、能源效率、机器学习、音视频和语言处理、数据压缩模型生成、个性化与联邦学习、强化学习、AI编译器和算法等AI前沿基础理论研究领域均有不少研究成果发布。

高通AI研究主要涉及领域,来源:高通
比如在今年的CVPR上,高通展示了全球首个在移动设备上通过神经编解码器对1080P视频进行编码和解码的演示。根据实际演示视频,在搭载高通芯片的智能手机上,神经编解码器进行视频解码的速度已经达到了35FPS左右。

在手机上进行的1080P神经网络视频编码,来源:高通
与此同时,高通在前沿算法和模型开发领域一直持续迭代自己的技术,比如具备自主学习能力的FrameExit模型、应用在移动终端上的量化技术和创新的编译器栈等。
高通利用INT4模型在终端侧实现了全球首个实时超级分辨率任务处理,与INT8相比,INT4模型的性能和能效提高了1.5倍到2倍。
可以说,十五年来高通在AI领域的深厚积累,已经成为今天他们发力生成式AI、推进混合AI发展的关键技术底蕴。
高通的身影一直活跃在AI技术前沿研究领域,一面连接学术界、产业界,推动着技术的发展,一面连接消费者,完善技术落地产品的体验,高通无疑已经成为“混合AI时代”加速生成式AI落地终端的核心推动者。
结语:生成式AI加速落地终端,AI产业涌现新变量
今天,生成式AI对各行各业产生深刻影响,几乎所有科技公司,都已卷入生成式AI的浪潮。
终端AI应用的深度广度都在加速扩张,云端和终端协同工作的混合AI将成为生成式AI体验的底层保障。百亿甚至千亿规模参数大模型落地终端,也将在不久的将来成为现实。
在未来端云结合的混合AI时代,能够提供全套解决方案的玩家必然会成为产业关注的焦点, 作为底层技术和生态构建者的高通,正成为产业中不可或缺的一环。端侧AI的应用正在迎来一次“进化”,而高通正在为这次革命按下加速键。
大家都在看
-
为啥说社会主义制度最科学?这三个日常细节,戳中每个普通人! 提起“社会主义制度”,可能有人觉得太抽象,其实它藏在咱们每天的生活里,是真真切切让普通人受益的“科学设计”。为啥说它是人类社会迄今为止最科学的制度?不是空喊口号,而是实实在在解决问题、贴合人心。首先, ... 科技之最01-25
-
科技的光,该照向何方? 写字楼里的送餐机器人正灵活地穿梭于电梯间,它们精准地停在每个工位前,完成一次毫无差错的配送。不远处,无人快递车在马路上规整地行驶,车厢里装着人们网购的各式商品。这一幕幕看似科幻的场景,如今却已成为我们 ... 科技之最01-25
-
雷科技编辑部2025:没人追新iPhone,但买了这些「真香」产品 春节即将到来,在这种辞旧迎新的时候,也是大家做年度复盘的最好时机。过去一个月里,雷科技已经发布了多个企业、行业的年度回顾和盘点。而作为年度盘点中的保留环节,接下来该盘点一下雷科技编辑部小伙伴今年买了些 ... 科技之最01-25
-
麦克斯韦方程组与电磁学:科学史上最伟大的公式之一 大家好,我是你的科学史探索者。今天我们要穿越时空,走进一段令人震撼的科学革命——麦克斯韦方程组的诞生,以及它如何彻底改变了我们对电磁世界的认知。这不仅仅是一组数学公式,更是一扇开启现代科技大门的钥匙, ... 科技之最01-25
-
中国科技正高速崛起,但距离全球顶尖还有多远? 在过去的几个月里,从中兴芯片制造突破到核聚变研发进展,中国科技一次次被推到风口浪尖。网络上常见两种声音:有人大肆称中国已令世界震惊,也有人悲观地认为中国仍旧脆弱。这种截然相反的观点,恰好暴露了大众对科 ... 科技之最01-24
-
交付破10万!智己LS6铸就科技平权标杆,LS8携热望而来 今日,上汽集团旗下高端电动品牌智己汽车传来重磅消息:旗下热销车型LS6累计交付量已成功突破10万辆大关。与此同时,品牌宣布即将正式官宣新一代旗舰车型——智己LS8,引发市场高度期待。LS6:10万车主认证,科技平 ... 科技之最01-24
-
一核五阶多维:让县域孩子的科学梦想破土而出 “为什么有的树叶在秋天会变黄而有的树叶不会变黄呢?”“为什么机器人能够听懂我们说的话呢?”“为什么同一种蔬菜在太空里种植和在地球上种植的结果不一样呢?”孩子们心中这些天马行空的疑问,正是科学教育最珍贵 ... 科技之最01-24
-
中国量子科技有多强?若继续打破西方垄断,将引起新一轮科技革命 前言量子科技,这个看似神秘的技术领域,在悄悄改变着世界的格局。十年前,中国在很多高科技领域还是个跟跑者,现在在量子科技这个前沿赛道上跑到了第一梯队。从“九章”量子计算机的问世,到星地量子通信的实现,再 ... 科技之最01-23
-
从装订学徒到电学之父:法拉第与改变世界的科学传奇 在科学史上,很少有人能像迈克尔·法拉第那样,以卑微的出身铸就辉煌的成就,用纯粹的热爱改写人类文明的轨迹。这位19世纪最伟大的物理学家、化学家,从一名普通的装订学徒起步,凭借对科学的执着追求与惊人天赋,发 ... 科技之最01-23
-
牛顿与爱因斯坦:站在物理学巅峰的巨人,改变人类历史的科学传奇 大家好!今天我们要探讨的是两位站在物理学巅峰、用智慧重塑世界的伟大科学家——牛顿和爱因斯坦。他们不仅仅是科学的探索者,更是人类认知的开拓者。他们的科学成果,深刻地揭示了世界的本源、现在和未来,成为人类 ... 科技之最01-23
相关文章
- 牛顿与爱因斯坦:站在物理学巅峰的巨人,改变人类历史的科学传奇
- 【好评中国】河声丨科技“丰收年”里,读懂中国,看见未来
- 红魔11 Air上手:无孔直屏+实体风扇,游戏手机卷向新赛道
- 一克千金!造火箭卫星离不开的“黑科技”,曾被日美垄断
- 以系统思维加快高水平科技自立自强
- 投票啦!科研最美瞬间等你来选!
- 中国科学院院士、西湖大学校长施一公到访重庆一中,为师生讲述“生命科学之美”
- 华天科技:全球第六的练成与代价——买来的技术与长不出的能力
- 壁仞科技崛起背后:“第一猎头”全球挖人
- 中国制造重机枪时,因一个低级的错误,却意外造就世界之最
- 4000年前的史前黑科技:龙山文化三大未解之谜,至今无人能复刻
- 为何西方都认为中国最强盛的并非汉唐而是拥有先进科技的此朝
- 解码“生命科学之美”!施一公院士走进重庆八中
- 欧拉:数学史上的百科全书,开启现代科学的黄金钥匙
- xAI“格罗克”深度伪造色情图像诉讼是美国科技伦理最棘手的问题
- HBM风口下,通富微电、华天科技、长电科技 深科技谁最值得关注?
- 珠海神话:中国最牛民办大学之一的大学(珠海科技学院)如何炼成
- 2025:中国科技引爆全球!12个月改写人类命运,未来已来
- 甘肃酒泉,到底骗了多少人?居然拥有 10 个 “世界之最”!
- 中国量子异军突起,或将引爆新一轮科技革命
热门阅读
-
万事胜意不能乱说的原因?告诉你万事胜意该对谁说 12-09
-
科威特第纳尔为什么那么值钱?比美元值钱的货币盘点 12-22
-
撕心裂肺十大催泪情歌,10首哭到崩溃的歌曲 12-24
-
不敢公布马航真实原因,内幕曝光简直太惊人! 12-25
-
陈百强什么原因怎么走的,陈百强85事件是什么 01-05
-
麻将公式一定要背下来,麻将手气背转运小妙招 01-19
