Alpha注入超强计算知识,补足ChatGPT短板
选自Stephen Wolfram writings
作者:Stephen Wolfram
机器之心编译
编辑:悉闲
ChatGPT + Wolfram|Alpha= ?
自 ChatGPT 发布以来,人们每天都在解锁它的新能力。前段时间,有人用 ChatGPT 写了个神经网络,还有人将它做成了智能音箱,效果完爆当前市面上的大多数产品。
不过,在试用过程中,人们逐渐发现,ChatGPT 也有短板,其中之一便是不会解数学题。比如下面这道「鸡兔同笼」题,虽然乍一看,ChatGPT 的解题步骤似乎没有问题,但计算结果却是错的。

题目来自知乎用户 @李闯。
很多网友都表示自己遇到了这种情况,计算机科学家、Wolfram 语言之父 Stephen Wolfram 也是其中之一。不过,和普通人不同的是,Wolfram 为这一问题提出了解决之法。他认为,要从根本上解决 ChatGPT 的这个短板可能要耗费大量精力,不如将其与自己的 Wolfram | Alpha 知识引擎结合起来用,因为后者本就具有强大的结构化计算能力,而且也能理解自然语言。

在 Wolfram 看来,世界是可表示的,世界是可计算的,世界就是我们的知识。因此,他试图做的是:只要你能描述得出来想要什么,计算机就替你做。人来定义目标,然后计算机尽量去理解意思,并尽最大努力去执行。
为了完成这一目标,Stephen Wolfram 创造了以他自己名字命名的 Wolfram 语言和计算知识搜索引擎 Wolfram Alpha。Wolfram Alpha 于 2009 年 5 月 18 日正式发布,其底层运算和数据处理工作是通过在后台运行的 Mathematica 实现的。
因为 Mathematica 支持几何、数值以及符号式计算,并且具有强大的数学以及科技图形图像的可视化功能,所以 Wolfram Alpha 能够回答多种多样的数学问题,并将答案以清晰美观的图形化方式显示给用户。这种计算知识引擎为苹果的数字助理 Siri 奠定了坚实的基础。
Stephen Wolfram 认为,这款工具可以和 ChatGPT 实现完美互补。

在一篇博客中,Stephen Wolfram 完整地阐述了他的观点:
ChatGPT 和 Wolfram|Alpha
事情突然 “成了”,总是很神奇。2009 年的 Wolfram|Alpha、2020 年的 Physics Project 就给人这种感觉。而如今 OpenAI 的 ChatGPT 又以同样的方式惊艳众人。
我关注神经网络技术时间不短(实际上大概有 43 年)。但遍观近年来这一领域的各种成就,我依然觉得 ChatGPT 表现相当出色。它是突然出现的一个系统,可生成几乎媲美人类创作能力的文本。可以说很好很强大。而且我认为其成功将可能揭示一些关于人类思维本质的东西。
不过,尽管 ChatGPT 在自动处理类人范畴事件方面很优秀,但并非一切有用的事情都那么 “像出自人类之手”,而是会有一些更为规范和结构化的东西。事实上,近几个世纪间创立的数学、精确科学以及如今走热的计算等领域的范式,都是我们的伟大文明成就,由此创造了一座有别于纯人类思维所能造就的能力之塔。
几十年来,我一直深入参与计算范式研究,着意于构建一种计算语言,用规范的符号系统表示更多事物。我的目标是通过所建系统 “以计算的方式辅助” 并增强人们想做之事;也可立即调用 Wolfram Language 和 Wolfram|Alpha,利用其特有的 “计算能力”,完成各种非人力所及的事情。
这种工作方式极为强大。但这不仅对人类来说重要,对类人 AI 同样重要。它可以即时赋予 AI 计算知识超能力,使其得以充分利用结构化计算和知识的非类人能力。
我们才刚开始探索这对 ChatGPT 的重要价值,未来想必前景可期。Wolfram|Alpha 与 ChatGPT 风格迥异,所做之事也大不相同。但二者又有连接点:自然语言。ChatGPT 可以像人类使用 Wolfram|Alpha 一样,与 Wolfram|Alpha “对话”,Wolfram|Alpha 会用其计算知识能力将从 ChatGPT 获得的自然语言转变为精确的符号化计算语言。
几十年来,学术界在 ChatGPT 使用的这类 “统计方法” 和 Wolfram|Alpha 的实际出发点 “符号方法” 的见解上一直存在分歧。但如今 ChatGPT 的成功和我们让 Wolfram|Alpha 理解自然语言的一切努力,给了我们将这些成果融合做强的机会。
举个例子:芝加哥到东京有多远?
ChatGPT 本质上是一个语言输出生成系统,它 “遵循” 网络、书籍和其他各种训练材料内容的 “模式”。无论是从某个小点还是整个篇章来看,它的输出都很像人类,这一点难能可贵。它能表达连贯的东西,用上所学概念,说出来往往还挺有意思,让人惊喜。它总能生成 “统计上可信的” 结果,至少在语言层面上是这样。但这并不能说明它信心十足地给出的所有答案和计算就都是正确的。
这是我刚注意到的一个例子(ChatGPT 的输出本质上是随机的,所以如果你也问这个问题,答案可能不尽相同):

这个答案似乎令人信服,但并不对,因为 Wolfram|Alpha 告诉我们:

这其实正是 Wolfram|Alpha 擅长的事情:充分利用其结构化、高精准的知识将某事转化为精确计算。
所以好消息就是,可以考虑让 Wolfram|Alpha 自动帮助 ChatGPT 解决这个问题。我们可以用编程方式向 Wolfram|Alpha 提问(也可使用 web API 等):

再次向 ChatGPT 提问,附上前文结果:

ChatGPT 很礼貌地接受更正,如果再次问这个问题,它会给出正确的答案。显然,用 Wolfram|Alpha 很可能有更精简的方式来处理这样的前后转换,但令人欣慰的是,即便是这种非常简单的纯自然语言方法也已经奏效。
但为什么 ChatGPT 一开始会弄错?如果它在训练中就注意到芝加哥和东京之间的明确距离(比如从网上),当然也能答对。但只掌握这种简单的解决方法还不够,它需要一种实际的算法。
Wolfram|Alpha 的处理方式截然不同。它假设能将采集到的自然语言转换为精确的计算语言(即 Wolfram 语言),在这个示例中:

城市坐标和计算城市间距离的算法是 Wolfram Language 中内置计算知识的一部分。而且,Wolfram Language 确实拥有大量内置计算知识,这也是我们几十年努力工作的成果。我们通过精心管理海量持续更新的数据,利用(并且经常发明)各种方法、模型和算法,建立了一个完整连贯的计算语言系统。
再举几个例子
ChatGPT 和 Wolfram|Alpha 的工作方式迥异,且各有优势。但要了解 ChatGPT 能在哪些方面利用 Wolfram|Alpha 的优势,我们来讨论一些 ChatGPT 自己做得不够正确的情况。有一个领域让 ChatGPT 和人类都感到痛苦 —— 数学。

这个论述式回应挺有意思。但实际结果是错的:

但是,如果 ChatGPT “咨询” 一下 Wolfram|Alpha,也能做对。
我们来试一些稍微复杂的内容:

乍一看,这个结果好像是那么回事,我可能都要相信了。但事实证明,这也是错的,Wolfram|Alpha 告诉我们:

而且,确实,用 ChatGPT 做数学作业(如果不咨询 Wolfram|Alpha)可能不太美妙。它会给你一个看似非常合理的答案:

但如果没能 “真正理解数学”,ChatGPT 基本上不可能稳妥地得出正确答案。这样一来,答案又是错的:

尽管如此,ChatGPT 还能对 “它是如何到答案的” 做出看似非常合理的解释(并不是说 “事实确实如何”)。而且有趣的是,它给出的解释有着类似不懂数学的人会犯的错误:

在各种情况下,“不能真正理解事物含义” 可能会引发麻烦。
下面这个例子好像很有说服力,但并不正确:


ChatGPT 似乎在某些方面正确了解了这些基础数据,但它所 “理解的含义” 不足以对数字准确排序:

人们会设想找到相应方法来 “修复这一特定错误”。但问题是,像 ChatGPT 这样基于生成语言的人工智能系统,其基本思想并不适合结构化计算任务。换言之,ChatGPT 需要 “修复” 几乎无穷多的 “bug”,才能修补 Wolfram|Alpha 以其结构化方式能修复的一丁点问题。
“计算链” 越复杂,就越有可能需要调用 Wolfram|Alpha 来解决问题。ChatGPT 对以下问题给出的答案相当迷惑:

而且,正如 Wolfram|Alpha 告诉我们的,以上结论并不正确(因为在某种意义上它已经 “知道” 了):

当涉及到具体(如定量)数据,即便是相当原始的数据,做得更出色的似乎也依然是 Wolfram|Alpha。下述示例灵感来自长期以来最受欢迎的 Wolfram|Alpha 问题 “How many turkeys are there in Turkey?”:

这次乍看之下依然完全合理,甚至引用了相关来源。然而,事实证明,这些数据基本上是 “虚构的”:

不过,很好的一点是,你可以很容易地要求 ChatGPT “核查事实”:

现在用 Wolfram|Alpha API 提供以下信息:

现在,我们注入此数据,让 ChatGPT 更正其原始答案(甚至会以粗体显示其在何处做了更正):

当涉及实时(或位置等相关)数据或计算时,“注入事实” 的能力就很可贵。ChatGPT 不会立即回答下面这个问题:

但这里有一些相关的 Wolfram|Alpha API 输出:

如果我们将上述信息输入 ChatGPT,将生成不错的 “论述风格” 结果:

有时候计算方法和类人模型之间存在着有趣的互动。问 Wolfram|Alpha 一个异想天开的问题(它甚至会核实你是否想要 “软冰淇淋”):

ChatGPT 起初对体积的概念有点困惑:

但随后似乎 “反应过来” 这么多冰淇淋其实有些搞笑:

路向何方
机器学习强大高效,特别是近几十年,这一领域成绩卓著,ChatGPT 可谓其最新成果。图像识别、语音到文本、语言翻译。每种应用都是 “猛然” 越过相应门槛。随之某些任务由 “基本毫无可能” 变成了 “基本可行”。
但结果也并不是 “完美” 的。或许有些东西在 95% 的情况下显效良好,但只消一试,剩下的 5% 仍不明朗。从某些角度来看,这可能就是失败。但关键是,对于各种重要用例,通常有 95% 的效用就已 “足够好”。也许是输出本就不存在真正意义上的 “正确答案”。也许只是人们在尝试找出人类或系统算法发展完善的可能性。
一次一个 token 生成文本的千亿参数神经网络可以完成 ChatGPT 所能做的事,相当了不起。想到这令人意外又瞩目的成功,人们可能会认为,只要 “训练出足够大的网络”,就可以畅所欲为了。但并非如此。计算的基本事实,特别是计算不可化约性的概念,让这种美好梦想难以实现。更重要的则如我们在机器学习的真实历程中所见 —— 会有巨大突破(就像 ChatGPT),进无止境。而且我们会发现,一些用例因机器学习之 “能” 而成,而不会囿于其 “不能”。
在很多情况下,“最初的 ChatGPT” 可以帮助人们写作、提建议或生成各种有用的文本。而一旦涉及创作完美事物,机器学习就不是理想路径了。其实要说完美,人类也一样束手无策。
这正是我们在上述示例中能看到的。ChatGPT 在 “类人范畴” 做得很好,因为没有严格意义上的 “正确答案”。如果 “非要” 让它进行精准操作,它通常会败下阵来。但重点来了,将 ChatGPT 连接到 Wolfram|Alpha 及其计算知识 “超能力”,会是很好的解决办法。
在 Wolfram|Alpha 内部,一切都会转化为计算语言,精确的 Wolfram Language 代码。在某种程度上,这些代码必须 “完美” 才能可靠使用。不过 ChatGPT 不必生成这样的代码,只需生成常规自然语言,然后 Wolfram|Alpha 可用其自然语言理解能力翻译成精确的 Wolfram Language。
在许多方面,有人可能会说,ChatGPT 从未 “真正理解” 过事物;它只是 “知道如何产出有用的东西” 罢了。Wolfram|Alpha 的故事就不同了。因为一旦 Wolfram|Alpha 将某些东西转换为 Wolfram Language,就能得到完整、精确、规范的表示,人们以此计算事物就有保证。不用说,很多 “有人情味” 的东西,并没有正式的算法表示,但我们仍然可以用自然语言来谈论,尽管可能不准确。在这方面,ChatGPT 自成一体,功能令人称奇。
就像我们人类一样,ChatGPT 有时需要更规范精准的 “助力”。但它不必 “规范而精准” 地表明所求。因为 Wolfram|Alpha 可与之进行相当于是 ChatGPT 母语的自然语言交流。而 Wolfram|Alpha 将负责在转换为自己母语 Wolfram Language 时 “进行规范和精准处理”。这个情况很好,我认为潜力巨大。
这种潜力不仅体现在典型的聊天机器人或文本生成应用层面。而且可以扩展到数据科学和其他形式的计算工作(或编程)。从某种意义上说,这种方式直接兼顾两个世界:ChatGPT 的类人世界和 Wolfram Language 的精确计算世界。
如果 ChatGPT 直接学习 Wolfram Language 会怎么样?嗯,确实可以,而且其实已经在做了。我特别希望像 ChatGPT 这样的模型最终能直接在 Wolfram Language 中高效运行。这种情形很特别也很有趣,因 Wolfram Language 的全面计算语言的特性而成就,可以用计算术语广泛谈论世界上有的没有的各种事情。
Wolfram Language 的整个概念在于接受人类思考的产物,然后通过计算来表示和处理。普通的编程语言只是提供某些方法告诉计算机具体该做什么。而 Wolfram Language 作为一种全面的计算语言,其作用远大于此。实际上,它意在成为人类和计算机都可用的 “以计算方式思考” 的语言。
几百年前,数学符号的发明,首次提供了一种 “以数学方式思考” 事物的精简媒介。其发明很快催生了代数和微积分,最终形成了各种数学科学。Wolfram Language 旨在为计算思维做些类似的事情,尽管不仅是为人类而做,同时以计算范式打开所有 “计算 X” 领域的大门。
我自己也因 Wolfram Language 作为 “思考语言” 受益匪浅,近几十年中,看到人们通过 Wolfram Language “以计算方式思考” 而取得如此进步,我倍感欣慰。那么 ChatGPT 呢?其实也可以进入这个领域。但具体怎么做,我也说不准。因为这并不是关乎 ChatGPT 要学习如何进行 Wolfram Language 已经实现的计算,而是关于 ChatGPT 学习如何像人类一样使用 Wolfram Language,是关于 ChatGPT 生成近乎 “创造性的文章”,不是用自然语言而是用计算语言。
我很早就讨论过人类用自然语言和计算语言混合交流写就计算论文的概念。现在的问题在于 ChatGPT 能否编写这些内容,能否将 Wolfram Language 用作一种不单向人类,而且向计算机传递 “有意义交流” 的方式。而且涉及 Wolfram Language 代码的实际执行很可能有一个有趣的反馈循环。关键是, Wolfram Language 代码所传达 “思想” 的丰富和动感有别于普通编程语言,更接近于 ChatGPT 在自然语言中 “神奇” 地处理的那类东西。
换言之,Wolfram Language 类似于自然语言 —— 是一种表达力很强的语言,可以想象在其中为 ChatGPT 编写一个有意义 “prompt” 的情形。是的,Wolfram Language 可以直接在计算机上执行;但作为 ChatGPT prompt,它可以用来 “表达一个想法”,其所在 “故事” 能够继续。可能也会描述一些计算结构,让 ChatGPT “即兴” 思考人们在计算上对这种结构的看法,取决于其通过阅读这么多人类所写东西学到的知识,“对人类来说很有趣” 的知识。
ChatGPT 的意外成功突然带来无限可能,令人兴奋。现在就有机会让 Wolfram|Alpha 赋予 ChatGPT 计算知识超能力。所以它不仅能产生高度 “似人输出”,还能利用封装在 Wolfram|Alpha 和 Wolfram Language 中的整个计算知识塔。
大家都在看
-
“龙虾”接管电脑的5分钟里,他的电脑被陌生人连了139次 “保护环境。”当你给AI发送这样一条极度简单、语义模糊的指令后,你期待它给你怎样的回应?解释环保的概念?给出保护环境的建议?慷慨激昂地发表一番绿色地球宣言?如果它没做这些,反而是悄无声息地删掉你一部分文 ... 机械之最03-13
-
第51届日内瓦国际发明展开幕 中国参展规模创新高 3月11日,在瑞士日内瓦举行的第51届日内瓦国际发明展上,人们在中国展位参观。新华社记者 王露 摄新华社日内瓦3月11日电(记者王露 马汝轩)第51届日内瓦国际发明展11日在瑞士日内瓦开幕,来自35个国家和地区的1000 ... 机械之最03-13
-
云深处科技的机器马有何特别之处 云深处科技的机器马“云驹”最特别之处,在于它成功地将传统文化符号、稳健的运动性能与前沿的具身智能技术融为一体,成为一匹能走进现实生活的“未来之马”。在AWE 2026展会上,这款马年限定产品凭借其独特魅力,瞬 ... 机械之最03-13
-
来时的路(一):第一机械工业部,那个管得最宽的“一机部” 朋友们好,从今天开始,我想跟你聊聊新中国工业史上那八个带着数字番号的“机械工业部”。这段历史有点长,有点复杂,但特别值得咱们坐下来好好唠唠。咱们先从一个故事开始。一、缘起:1952年,一机部开张了1952年8 ... 机械之最03-13
-
火骨纸魂、跃夜成光,五经富烟花火龙非遗重生全记录 在粤东莲花山脉深处,龙江水蜿蜒而过的五经富古镇,一项沉睡三十二年的民俗盛典,在丙午马年元宵之夜再度燃亮夜空。竹为骨、纸为肤、火为魂,三条近四十米长的烟花火龙穿云破雾,在漫天焰火中腾挪起舞,将三百年的客 ... 机械之最03-12
-
商鞅变法,最狠的改革,把弱秦变成战争机器 中国历史上,商鞅变法无疑是一次深刻而彻底的社会变革。它不仅改造了战国时期的秦国,使之迅速崛起为一支强大的军事力量,更为后来秦统一六国、建立中国第一个大一统帝国奠定了坚实基础。商鞅变法以其激进的改革措施 ... 机械之最03-12
-
P08炮兵型 当优雅鲁格遇上长枪管 它是手枪界的“狙击精英” 在世界轻武器史上,没有任何一把手枪能像鲁格P08那样,将精密钟表般的机械美感与武器的杀戮本能融合得如此天衣无缝。而在这座美学巅峰之上,还伫立着一个更为罕见、更具传奇色彩的异类——P08炮兵型(LP08)。它用一 ... 机械之最03-12
-
对比多家裁断机供应商,最终还是选智成!原因很实在 很多企业采购裁断机时,都会货比三家,对比品牌、价格、品质、服务,最终却纷纷选择智成机械,背后的原因简单又实在——综合实力碾压同行,性价比拉满,服务更贴心。与其他供应商相比,智成机械有三大核心优势,让企 ... 机械之最03-12
-
别再盲目劝退机械!大学生选对这几个方向,越老越吃香薪资节节高 网上关于 “机械专业劝退” 的声音,几乎每年高考志愿季都要刷屏一次。“又脏又累”“工资微薄”“夕阳产业”,这些标签像紧箍咒一样,让无数想学机械的考生望而却步,连不少在校生都开始焦虑转专业。但作为深耕机械 ... 机械之最03-11
-
“封龙”何以变“飞龙”——石家庄五大产业跃升记 封龙山,又名飞龙山,横亘在河北省石家庄市区西南,从汉代起即为当地教育中心。而今,封龙山下,一批现代化的企业成为带动当地经济、社会发展的龙头。“十四五”时期,石家庄市努力创新改革,以延链补链强链,打破低 ... 机械之最03-11
相关文章
- P08炮兵型 当优雅鲁格遇上长枪管 它是手枪界的“狙击精英”
- 对比多家裁断机供应商,最终还是选智成!原因很实在
- Nikon FM2:机械之心,永恒之魂
- 经常挖鼻孔,后来都怎么样了?有这种情况的人真的要注意了
- 别再盲目劝退机械!大学生选对这几个方向,越老越吃香薪资节节高
- “封龙”何以变“飞龙”——石家庄五大产业跃升记
- “6G网要来了”热搜第一!研发进入关键期,还要破解哪些难题
- “养龙虾”爆火之后,别把技术幻想当成生产力现实
- 阿基米德:喊“我找到了”古希腊狂人,杠杆和浮力都是他发明的!
- 小变化中的大图景——六位全国人大代表履职中的“微光”与“星河”
- 刀尖角:车刀里的 “隐形强者”,决定刀具寿命的关键密码
- 机械设计核心干货:5大常用机构,从原理到设计应用全掌握
- “工业牙齿”,价格飙涨超600%!
- 无数微小创新涌现,点亮一个壮阔未来——代表委员眼中的未来产业
- 首次写入政府工作报告的脑机接口,有何发展看点?
- 小型自动化面粉磨坊 · 四级认知:机械结构设计与制作
- 家有高中生:智造未来之机械类专业介绍
- 两会特别报道丨为梦想奋斗 为幸福打拼——从全国两会看民生福祉新画卷
- 机械考研别瞎报!300到370+分,每段都有最稳上岸的学校
- 连线湖南厅
热门阅读
-
天下第一暗器暴雨梨花针,传说中的唐门暗器做出来了 07-13
-
汽车投诉排行榜前十名汽车 问题最多的就是这些车 07-13
-
世界上最牛挖掘机,甚至可以挖穿一座城市 11-05
-
世界最大核潜艇制造厂,产量远超中美法 11-20
