在这三项能力上,讯飞星火已经超越了ChatGPT
AI大模型应该是目前整个科技行业最火热的概念,作为国内知名的AI领域的龙头企业,科大讯飞自然不会落后。很早开始,他们就在从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究。并且在过去几年,讯飞已经将很多产品和技术推向了包含电子消费、教育、医疗、办公、车载、智慧城市在内的多个行业和市场。
上周六,科大讯飞正式对外发布了新一代认知智能大模型——星火。这名字取自“星星之火,可以燎原”之意,体现了科大讯飞对于对于AGI的远景目标。除此之外,早在2001年科大讯飞“半场会议”上,创业团队就提出了“燃烧最亮的火把,要么率先燎原,要么最先熄灭”。同时 “星火”一词还来自中国传统文化二十八星宿中的“心宿”星座,被视为吉祥的象征,代表着力量、勇气和坚韧不拔的精神。所以从星火这个名字,也能看到讯飞的野心。
发布会后,我们第一时间深度体验了这款大模型,在这里我们分享一些我们对这款AI大模型的感受和体验。
中文自然语义理解能力更强
讯飞星火认知大模型在交互和界面设计上与大家熟悉的ChatGPT比较类似。作为一款对话类的自然语言模型,它通过自然对话方式做到对用户需求的理解与任务的执行。

既然是对话模型,首先要考验的是模型对于自然语义的理解能力。这方面中文相当有发言权。因为中文之所以复杂,除了本身表意的属性之外,在日常交流过程中,同样的文字、语句所表达的含义可能会随着语境、音调、习惯甚至是标点符号的变化而截然不同、传统的交互模型在面对中文这类复杂的自然语言的时候经常翻车,就是因为无法准确理解这些变化背后的含义。
举个例子:我单身的原因有两个:一是谁都看不上,二是谁都看不上。两个原因在语句上完全一样,但含义却截然不同。将中文作为母语的我们能够通过对整个语境的理解,很快明白二者之间的不同。
但AI会怎么理解呢?
我们将这句话输入ChatGPT,让它解释这两种说法有何不同。ChatGPT给出的解释是:

显然ChatGPT认为,这两种表述的意思都是一样的。只是“没有得到注意和认可”和“不被看重,缺乏吸引力”的区别。
再来看看讯飞星火给出的解释:

显然,讯飞星火模型给出的解释更为准确,它能够判断出这句话中“对别人的挑剔”,甚至还能够分析出一种说法是相对自嘲的,而第二种说法“显得自我膨胀”。这种判断是更符合我们对于这句话的双重理解的含义。
这里其实就体现了讯飞星火对于中文自然语义超高的理解能力,这主要是得益于其本身作为一款中国本土市场的AI模型,能够基于海量中文文本语料进行训练,同时在相关的核心算法上也更贴近与中文的使用环境和习惯,在对于中文自然语义的理解方面,讯飞星火认知大模型拥有先天的优势。



我们还输入了一些其他比较复杂,或者有多重含义的中文语句,讯飞星火都能够根据所在的语境的不同给出相对准确的判断,能够很自然的理解这些语句背后想要表达的真实意图。
生成文本能够“拿来即用”
相对于这些单一的自然语言的理解能力,文本生成能力应该是这类语言大模型在当下最具“生产力”的特性。讯飞星火同样支持强大的文本生成能力,它能够根据需求创作出邮件、讲稿、文案等等任何文本内容。
这种文本生产的过程非常简单,你只需要赋予身份、描述背景、提出需求,这三个步骤就能够让AI模型生成文本,最后你可以再根据生成的文本进行一些细节上的调整和条件的补充。经过我们的实测,讯飞星火大部分时候生成的文本,都能够做到“拿来即用”的水平。
还是举例来看,我们告诉讯飞星火:你现在是一位小学班主任,你的一名学生因为经常违反课堂纪律,现在需要给他的家长写一封书信,告诉他们孩子的基本情况并且希望他们能够协助你和学校妥善的解决这个问题。
以下是讯飞星火提供给我们的内容:

可以看到,讯飞星火能够根据你简单的描述,直接生成信件的基本内容。并且这封信件的内容本身在逻辑性、通顺性、可读性方面都没有什么问题。你可能注意到,这封信件的措辞和一些描述可能相对比较生硬和直接,需要修改地委婉一些。于是我们向讯飞星火提出需求:希望措辞能够委婉一些,并且淡化孩子违反纪律的描述,更注重强调孩子的教育和关切问题。

在我们提出了更细化的要求之后。讯飞星火能够准确理解“委婉”的含义,最终生成的文本内容在整体的措辞和语气方面都显得要温和许多。它甚至还能够自己拿出一些可行性的建议和意见,来解决存在的问题。让整个信件内容传达出了对孩子问题的关注,以及希望寻求家长的协助,共同来帮助他解决问题的态度。
现实中如果你真的想要借助星火来生成一些文本内容。你可以向它提出一些更为具体和细致的要求,进而获得更理想的最终文本。实际上,仅从文本内容的创作能力来看,讯飞星火这类AI的水平已经超过了大多数的普通人。


未来的想象空间还很大
除了上述的这些能力之外,讯飞星火还在诸多场景化的能力方面做出了尝试和创新。
比如在多题型可解析数学能力能力上,星火认知大模型目前就具备很强的能力,能够解答常见的计算、几何、方程、代数以及情景应用题等,我们尝试过将一些初高中的数学题直接输入模型,模型能够直接生成运算步骤和答案,准确率非常高。

尤其是在一些涉及到大量中文自然语义的情景应用题型上,星火认知大模型能够凭借自身更为本土化的中文语义理解能力,在运算的精确性上很多时候比GPT还要高。我们都知道,讯飞这些年在教育领域一直都有深入的拓展,推出了很多面向教育市场的产品,后续借助讯飞星火大模型的能力,这些教育类产品能力将会得到飞速提升,也将会给教育行业带来更多的赋能。从长远来看,讯飞在这方面的创新和布局,拥有很广阔的应用前景和想象空间。
和当前行业其他的大模型相比,讯飞星火目前在核心算法、数据积累、算力支撑等方面都有自己的独到优势。短期来看,立足于讯飞本身在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术方面优势积累,接下来我们有望看到讯飞星火能够不断地进行技术迭代,尤其是在中文认知的智能领域,有望实现对ChatGPT这样的行业标杆的追赶。

讯飞官方表示,当前讯飞星火在文本生成、语言理解、数学能力方面已经超过了ChatGPT。并且讯飞官方也公布了接下来的迭代升级时间节点:6月9日,星火将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8月15日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队;10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。
讯飞星火采用的是“1+N”架构,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。

在这次讯飞星火的发布会上,科大讯飞就重点发布了星火认知大模型在教育、办公、汽车、数字员工等行业的应用成果。比如给我们留下非常深刻印象的“星火认知大模型+讯飞听见”。借助星火认知模型的能力,还能够对文字内容进行深度分析,可以一键生成包括新闻稿件、宣传文案、多语种翻译等多种文本内容,它甚至还可以根据内容,进行提问追溯。对于我们这样的文字工作者来说,这些功能无疑是我们一直以来都梦寐以求的。
类似的应用场景还有教育行业,讯飞已经将星火认知大模型的强大能力加入到自家的学习机、办公本、录音笔等智能硬件设备上,实现诸如类人批改和修订语篇规整等多重的智慧能力。这些新功能的加入能够极大提升现有产品的使用体验,真正做到生产力的大幅度提升。另外,当前讯飞在国内车载智能语音应用已经做到了市场占有率第一,这一次认知大模型技术会让车载人机交互再上一个新的台阶,实现更自由、更拟人化地沟通。
未来,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,这也是接下来,讯飞这款大模型最值得关注的看点。

目前讯飞已经将星火认知大模型加入到了讯飞开放平台,将赋能开发者打造更具价值的AI应用。官方还宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型“星火”生态。
这里也可以看出讯飞“星火”命名的背后含义,尽管目前它还是一个星星之火,但在可见的未来,它很有可能成长为AI领域的燎原之势,能力不容小视。
下一篇:维多利亚时代的科学架桥者
大家都在看
-
群星闪耀时——致敬中国科技脊梁! “路漫漫其修远兮,吾将上下而求索。”这种朝梦想执着追求的精神,正是中国科技工作者最真实的写照。钱学森以毕生才学报效家国,誓言“要让中华儿女在尊严中追寻幸福”;袁隆平将论文写满神州沃野,“禾下乘凉梦”和 ... 科技之最06-01
-
最前沿科技与最古老文明的碰撞:谁在重构文化生活? 机械关节轻转,随着指尖发力拨动琴弦,《荷塘月色》的曲调从古筝上倾泻而出。2025年第二十一届中国(深圳)国际文化产业博览交易会(以下简称文博会),广东展团文化与机器人展区,这个坐在古筝前抚琴的机器人凭才艺 ... 科技之最05-29
-
比老美快100万倍,国产祖冲之三号诞生,硅谷科技霸权终结? 【中国量子计算机碾压美国! 祖冲之三号如何上演科技突围战? 】量子世界里那只既生又死的猫,竟被中国科学家"驯化"成破局密码? 3月3日,中科大潘建伟团队扔出一枚"科技核弹"——182个耦合比特构建 ... 科技之最05-28
-
宁夏:科技之光照亮网红打卡地 科技日报记者 王迎霞 5月24日,2025年宁夏科技活动周在银川览山公园启幕。此次活动尝试将主场设在网红打卡地,吸引4万余名市民参与其中。览山公园是银川新晋的网红地标。每逢黄昏,夕阳会斜切过56根罗马柱,在阶梯式 ... 科技之最05-27
-
感受科技之光,提升科技素养——望江初中举行科技研学活动 为拓宽学生视野,丰富学习体验,5月22日,望江初中一校两区八年级部分学生踏上了充满探索与挑战的研学之旅。这场由望江县科协举办的以“感受科技之光,提升科技素养”为主题的活动,串联起航天科技馆的浩瀚星海、射 ... 科技之最05-27
-
以改革促学科交叉融合“化学反应”,复旦推动科技创新势能向产业创新动能转化 在危险环境作业中,一个令人叹为观止的人形机器人背后,往往有一个遥操作系统。远程操作的关键挑战是通信延迟,当下的技术方案至少延迟60毫秒。日前,复旦大学可信具身智能研究院院长姜育刚团队,首次实现不到20毫秒 ... 科技之最05-27
-
UASE 2025观察:不只是大疆无人机,低空经济也已起飞 在1月的CES、2月的MWC、3月的AWE后,属于5月的UASE 2025如期而至。和前面三次主要面向消费者群体的大型会展不同,深圳国际无人机展览会(UASE 2025)更像是一个为产业链提供的舞台。当然,除了买卖双方可以再次精确 ... 科技之最05-26
-
智能眼镜进入618主场!这三类产品最值得入手,怎么办? 前段时间,雷鸟宣布将在 5 月 27 日发布 Rayneo X3 Pro、Air 3s 两款智能眼镜新品。而这两款产品的加入,也意味着国内智能眼镜「布局」阶段的结束,行业即将进入「贴身肉搏」市场竞争阶段。从网上的评论来看,不少消 ... 科技之最05-26
-
科技之光闪耀三江之源 丁玉梅 陆广涛活动现场的科技工作者。青海日报记者 陆广涛 丁玉梅 摄“科学的春天来到了……”在激昂的歌声中,星耀高原——青海省“最美高原奋斗者之最美科技工作者”发布仪式,于5月25日举办。恰逢第二十五个全国 ... 科技之最05-26
-
2024年中国十大科技成就,每一项都让国人为之自豪! 2024年6月25日14时7分,嫦娥六号返回器携带来自月背的月球样品安全着陆在内蒙古自治区四子王旗预定区域,这标志着探月工程娥六号任务取得圆满成功。这壮丽的航天图景恰似2024年中国科技版图的缩影——接下来我们将为 ... 科技之最05-25
相关文章
- 谢尔盖·布林:科技巨头的背后,72个瞬间的启示
- 钱永刚、叶光富……科学界的“顶流”都来啦!“科学大讲堂”在成都开讲
- 唐骋:今天的我们比历史上大多数时刻的人都更具科学精神
- 科学邂逅浪漫!杭州青年科技工作者用智慧与温情共赴“心动之约”
- 登科技之梯,摘文化星辰——第二十一届深圳文博会湖南展馆见闻
- 中国历史上的科技发明之最
- 5月23日,与许知远、蒋昌建共同对话青年科技创新者
- 看,量子科技“打开”新世界
- 基础科学最重大突破?量子引力终于要来了?爱因斯坦会敲棺材板吗
- 科技味最浓的一届展会 2025畜博会智慧养殖成潮流 低日粮技术研发“你追我赶”
- 3轨+英文+X!102岁复旦政治学老根发新枝
- 阿基米德:古代科学的巨匠与智慧的化身
- 从实验室到百姓家:中国量子科技产业化提速
- MIT研究颠覆百年常识,鸡蛋这样摔最抗造!
- 科学哲学8——科学哲学之方法论
- 金力:聚焦“四个最前沿”深化科技体制改革,推动科技创新和产业创新深度融合
- 最in,最炫,拉满科技感、给足未来感
- 爱因斯坦:从一颗“相对”的脑袋到改变世界的科学巨星!
- 天马科技靠“水中软黄金”逆袭,风险与难题待解
- 2025 科技圈王炸!这 5 大突破,正在改写人类未来
热门阅读
-
万事胜意不能乱说的原因?告诉你万事胜意该对谁说 12-09
-
科威特第纳尔为什么那么值钱?比美元值钱的货币盘点 12-22
-
撕心裂肺十大催泪情歌,10首哭到崩溃的歌曲 12-24
-
不敢公布马航真实原因,内幕曝光简直太惊人! 12-25
-
陈百强什么原因怎么走的,陈百强85事件是什么 01-05
-
麻将公式一定要背下来,麻将手气背转运小妙招 01-19