在这三项能力上,讯飞星火已经超越了ChatGPT
AI大模型应该是目前整个科技行业最火热的概念,作为国内知名的AI领域的龙头企业,科大讯飞自然不会落后。很早开始,他们就在从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究。并且在过去几年,讯飞已经将很多产品和技术推向了包含电子消费、教育、医疗、办公、车载、智慧城市在内的多个行业和市场。
上周六,科大讯飞正式对外发布了新一代认知智能大模型——星火。这名字取自“星星之火,可以燎原”之意,体现了科大讯飞对于对于AGI的远景目标。除此之外,早在2001年科大讯飞“半场会议”上,创业团队就提出了“燃烧最亮的火把,要么率先燎原,要么最先熄灭”。同时 “星火”一词还来自中国传统文化二十八星宿中的“心宿”星座,被视为吉祥的象征,代表着力量、勇气和坚韧不拔的精神。所以从星火这个名字,也能看到讯飞的野心。
发布会后,我们第一时间深度体验了这款大模型,在这里我们分享一些我们对这款AI大模型的感受和体验。
中文自然语义理解能力更强
讯飞星火认知大模型在交互和界面设计上与大家熟悉的ChatGPT比较类似。作为一款对话类的自然语言模型,它通过自然对话方式做到对用户需求的理解与任务的执行。

既然是对话模型,首先要考验的是模型对于自然语义的理解能力。这方面中文相当有发言权。因为中文之所以复杂,除了本身表意的属性之外,在日常交流过程中,同样的文字、语句所表达的含义可能会随着语境、音调、习惯甚至是标点符号的变化而截然不同、传统的交互模型在面对中文这类复杂的自然语言的时候经常翻车,就是因为无法准确理解这些变化背后的含义。
举个例子:我单身的原因有两个:一是谁都看不上,二是谁都看不上。两个原因在语句上完全一样,但含义却截然不同。将中文作为母语的我们能够通过对整个语境的理解,很快明白二者之间的不同。
但AI会怎么理解呢?
我们将这句话输入ChatGPT,让它解释这两种说法有何不同。ChatGPT给出的解释是:

显然ChatGPT认为,这两种表述的意思都是一样的。只是“没有得到注意和认可”和“不被看重,缺乏吸引力”的区别。
再来看看讯飞星火给出的解释:

显然,讯飞星火模型给出的解释更为准确,它能够判断出这句话中“对别人的挑剔”,甚至还能够分析出一种说法是相对自嘲的,而第二种说法“显得自我膨胀”。这种判断是更符合我们对于这句话的双重理解的含义。
这里其实就体现了讯飞星火对于中文自然语义超高的理解能力,这主要是得益于其本身作为一款中国本土市场的AI模型,能够基于海量中文文本语料进行训练,同时在相关的核心算法上也更贴近与中文的使用环境和习惯,在对于中文自然语义的理解方面,讯飞星火认知大模型拥有先天的优势。



我们还输入了一些其他比较复杂,或者有多重含义的中文语句,讯飞星火都能够根据所在的语境的不同给出相对准确的判断,能够很自然的理解这些语句背后想要表达的真实意图。
生成文本能够“拿来即用”
相对于这些单一的自然语言的理解能力,文本生成能力应该是这类语言大模型在当下最具“生产力”的特性。讯飞星火同样支持强大的文本生成能力,它能够根据需求创作出邮件、讲稿、文案等等任何文本内容。
这种文本生产的过程非常简单,你只需要赋予身份、描述背景、提出需求,这三个步骤就能够让AI模型生成文本,最后你可以再根据生成的文本进行一些细节上的调整和条件的补充。经过我们的实测,讯飞星火大部分时候生成的文本,都能够做到“拿来即用”的水平。
还是举例来看,我们告诉讯飞星火:你现在是一位小学班主任,你的一名学生因为经常违反课堂纪律,现在需要给他的家长写一封书信,告诉他们孩子的基本情况并且希望他们能够协助你和学校妥善的解决这个问题。
以下是讯飞星火提供给我们的内容:

可以看到,讯飞星火能够根据你简单的描述,直接生成信件的基本内容。并且这封信件的内容本身在逻辑性、通顺性、可读性方面都没有什么问题。你可能注意到,这封信件的措辞和一些描述可能相对比较生硬和直接,需要修改地委婉一些。于是我们向讯飞星火提出需求:希望措辞能够委婉一些,并且淡化孩子违反纪律的描述,更注重强调孩子的教育和关切问题。

在我们提出了更细化的要求之后。讯飞星火能够准确理解“委婉”的含义,最终生成的文本内容在整体的措辞和语气方面都显得要温和许多。它甚至还能够自己拿出一些可行性的建议和意见,来解决存在的问题。让整个信件内容传达出了对孩子问题的关注,以及希望寻求家长的协助,共同来帮助他解决问题的态度。
现实中如果你真的想要借助星火来生成一些文本内容。你可以向它提出一些更为具体和细致的要求,进而获得更理想的最终文本。实际上,仅从文本内容的创作能力来看,讯飞星火这类AI的水平已经超过了大多数的普通人。


未来的想象空间还很大
除了上述的这些能力之外,讯飞星火还在诸多场景化的能力方面做出了尝试和创新。
比如在多题型可解析数学能力能力上,星火认知大模型目前就具备很强的能力,能够解答常见的计算、几何、方程、代数以及情景应用题等,我们尝试过将一些初高中的数学题直接输入模型,模型能够直接生成运算步骤和答案,准确率非常高。

尤其是在一些涉及到大量中文自然语义的情景应用题型上,星火认知大模型能够凭借自身更为本土化的中文语义理解能力,在运算的精确性上很多时候比GPT还要高。我们都知道,讯飞这些年在教育领域一直都有深入的拓展,推出了很多面向教育市场的产品,后续借助讯飞星火大模型的能力,这些教育类产品能力将会得到飞速提升,也将会给教育行业带来更多的赋能。从长远来看,讯飞在这方面的创新和布局,拥有很广阔的应用前景和想象空间。
和当前行业其他的大模型相比,讯飞星火目前在核心算法、数据积累、算力支撑等方面都有自己的独到优势。短期来看,立足于讯飞本身在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术方面优势积累,接下来我们有望看到讯飞星火能够不断地进行技术迭代,尤其是在中文认知的智能领域,有望实现对ChatGPT这样的行业标杆的追赶。

讯飞官方表示,当前讯飞星火在文本生成、语言理解、数学能力方面已经超过了ChatGPT。并且讯飞官方也公布了接下来的迭代升级时间节点:6月9日,星火将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8月15日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队;10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。
讯飞星火采用的是“1+N”架构,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。

在这次讯飞星火的发布会上,科大讯飞就重点发布了星火认知大模型在教育、办公、汽车、数字员工等行业的应用成果。比如给我们留下非常深刻印象的“星火认知大模型+讯飞听见”。借助星火认知模型的能力,还能够对文字内容进行深度分析,可以一键生成包括新闻稿件、宣传文案、多语种翻译等多种文本内容,它甚至还可以根据内容,进行提问追溯。对于我们这样的文字工作者来说,这些功能无疑是我们一直以来都梦寐以求的。
类似的应用场景还有教育行业,讯飞已经将星火认知大模型的强大能力加入到自家的学习机、办公本、录音笔等智能硬件设备上,实现诸如类人批改和修订语篇规整等多重的智慧能力。这些新功能的加入能够极大提升现有产品的使用体验,真正做到生产力的大幅度提升。另外,当前讯飞在国内车载智能语音应用已经做到了市场占有率第一,这一次认知大模型技术会让车载人机交互再上一个新的台阶,实现更自由、更拟人化地沟通。
未来,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,这也是接下来,讯飞这款大模型最值得关注的看点。

目前讯飞已经将星火认知大模型加入到了讯飞开放平台,将赋能开发者打造更具价值的AI应用。官方还宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型“星火”生态。
这里也可以看出讯飞“星火”命名的背后含义,尽管目前它还是一个星星之火,但在可见的未来,它很有可能成长为AI领域的燎原之势,能力不容小视。
下一篇:维多利亚时代的科学架桥者
大家都在看
-
2399元起!「性能旗舰新选择」一加 Ace 6T发布:同档找不到对手 2025 年 12 月 3 日,一加在杭州萧山瓜沥文化体育中心正式发布「性能旗舰新选择」一加 Ace 6T。雷科技受邀到现场参与报道。图源:一加外观方面,一加 Ace 6T 搭载了一块 6.83 英寸的 OLED 直屏,机身背部用的是「金 ... 科技之最12-05
-
13亿欧元的败笔:科学史上最昂贵的实验 史上最昂贵的科学实验:为什么我们造不出“大脑”?2013 年,欧洲科学界发生了一件大事。一位极具个人魅力的神经科学家亨利·马克拉姆(Henry Markram),站在了 TED 的舞台中央。他向全世界许下了一个宏愿:给我 10 ... 科技之最12-05
-
华为日照金山路由器评测:路由器有颜了,对得起1299元的价格 日前,华为发布了一款备受关注的路由器产品:华为日照金山路由器。作为可能是市面上最好看的路由器,雷科技编辑部小伙伴们对这款产品十分感兴趣,要知道,在这款产品出现前,几乎没人关心过路由器的颜值。那么,除了 ... 科技之最12-05
-
口出狂言?初代网红罗永浩:我不会被限流,除非我「死」了 12 月 2 日消息,今天微博上有个网友提出疑问:罗永浩为什么能长盛不衰?罗永浩本人转发表示:只有死亡才能构成真正有效的限流。图源:微博截图嚯,老罗对自己的“流量体质”真有信心。话说回来,今天都周二了,答应 ... 科技之最12-05
-
CES官方剧透来了!AI成“绝对焦点”,AI硬件成全场主角 将于 2026 年 1 月 6 日到 9 日于美国拉斯维加斯举行的CES2026,已进入倒计时阶段。从 1967 年创办至今,历经近 60 年的 CES(Consumer Electronics Show,国际消费类电子产品展览会),早已成为全球消费电子行业的 ... 科技之最12-05
-
华为Mate 80 实测称王:无惧户外强光,中国屏亮天下 文/柳华芳 「科技先生」出品没有线下发布会,11月25日线上发布,华为Mate 80系列依旧做到了门店火爆、一机难求。过目不忘的双环设计、超透亮灵珑屏、户外探索模式......从设计上的光环之王,到惊叹的技术创新,每一 ... 科技之最12-05
-
火药味十足!荣耀高管犀利点评豆包手机:并不看好,撑不过三代 12 月 4 日消息,日前字节发布了豆包手机,现已售罄。价格 3499 元,搭载骁龙 8 至尊版处理器,有三颗 5000 万像素的摄像头。豆包手机在二手市场的售价最高已被炒至 7999 元。图源:豆包官网小雷从演示视频看到,用 ... 科技之最12-05
-
下周,科技板块最受投资者关注! 对于下周A股市场的潜力板块和方向选择,科技板块看好比例大幅提升。本周(11月24日至28日),A股市场震荡走高,成交规模维持在1.5万亿元上方。指数方面,上证指数本周上涨1.4%,最新报3888.60点;深证成指上涨3.56% ... 科技之最12-01
-
中国基建再出王炸,香山大桥创下3项世界之最,老外直呼不可能 没有惊天动地的宣传,一座横跨海湾的超级大桥悄然刷新世界纪录——香山大桥,这座中国基建的新标杆,用3项全球首创技术,在波涛之上架起“海上长虹”,让世界看见中国工程的硬核实力!今天就带大家解锁这座大桥的传 ... 科技之最11-30
-
科技前线 微观世界中,电子具有“自旋”的基本属性,这些“自旋”如同一个个微小磁针。材料的较多宏观特性,如磁铁的磁性或超导体的零电阻,皆源于这些微观磁针的排列方式与相互作用。日前,中国科学技术大学与浙江大学合作, ... 科技之最11-30
相关文章
- 为什么要强化科学研究、技术开发原始创新导向
- 中国基建再出王炸,香山大桥创下3项世界之最,老外直呼不可能
- 科技前线
- “开路小工”,科技强国大有作为!
- 红色地标上新+2!快来预约吧!
- “欧拉:数学界的天才魔术师,开启科学黄金时代的奇幻之旅”
- 标题:他洗澡发现浮力用杠杆放言撬动地球!阿基米德“科学狂人”
- 武汉进入全球前10强!打造5大高科技之谷!冲刺国家中心城市!
- 他用一粒苹果,撬动整个宇宙一一牛顿,科学王座上的孤独巨人
- 3999元!夸克S1首发评测:一款眼镜装下了淘宝、高德和支付宝
- 与鸿蒙共赴星光之约:当科技成为生活中最贴心的队友
- 年销量或破400万!智能戒指起风了,国产厂商这波却输得很惨
- 「微光力量」让科技更有温度!用脑机接口解码生命信号,强脑科技推动科技助残走向普惠
- 新国标要来了!充电宝要涨价?好消息是能用更多年了
- 被忽视的科技之光:这些中国技术正在重塑你的日常生活
- 时隔两年的回归:骁龙8 Gen 5到底变了什么?
- 蔡司,凭什么打造出“上帝之眼”?
- Gemini+TPU双线破局!顶级科技投资人“火上浇油”:七巨头中Alphabet最值得持有
- AI硬件先驱要成先烈了!Rabbit到底做错了什么?
- 赛场内外处处彰显科技范儿,从全运会看中国创新
热门阅读
-
万事胜意不能乱说的原因?告诉你万事胜意该对谁说 12-09
-
科威特第纳尔为什么那么值钱?比美元值钱的货币盘点 12-22
-
撕心裂肺十大催泪情歌,10首哭到崩溃的歌曲 12-24
-
不敢公布马航真实原因,内幕曝光简直太惊人! 12-25
-
陈百强什么原因怎么走的,陈百强85事件是什么 01-05
-
麻将公式一定要背下来,麻将手气背转运小妙招 01-19
