可“解难题”也可“出好题”!中国科学家取得通用人工智能逻辑推理新突破

发布者:熊猫木木 2026-1-27 10:06

新华社北京1月26日电(记者魏梦佳)中国科研团队近日自主研发出的一款“通矩模型”,该成果26日晚在线发表于国际权威学术期刊《自然-机器智能》。相关专家表示,这是国际首个同时具备自主出题和自动解题双重能力的通用人工智能系统,标志着中国科研团队在自动化推理的逻辑核心领域实现关键技术自研,并在性能与功能多样性上达到国际领先水平。

据了解,长期以来,AI在逻辑推理领域面临着两大核心挑战:一是“组合爆炸”,即几何推理往往需要寻找并添加精妙的辅助线,每增加一个点或圆,搜索空间(即探索模型中所有可能的解决方案)都会呈指数级增长;二是“高质量数据匮乏”,即现有的几何题目库规模较小,难以支持大规模模型的训练。

由北京通用人工智能研究院、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院以及北京大学武汉人工智能研究院组成的联合科研团队,通过开发一套精密的逻辑推理搜索架构,将复杂的几何世界抽象建模,使AI系统能像人类数学家一样,在逻辑推理每个节点上都能进行有序地系统性探索,避免了无效的重复尝试。

据悉,团队创新性地引入了“规范化表示”技术。这套机制赋予了AI一种“识破伪装”的能力:在复杂的几何空间中,同一个命题往往会因为图形的旋转、翻转或缩放而产生无数种表现形式。通矩模型能自动识别并合并这些对称或同构的拓扑结构,将庞杂的搜索空间压缩了几个数量级。例如,无论一个三角形在空间中如何摆放,系统都能精准锁定其本质的几何关系。这种对物理对称性的深度利用,极大地提升了搜索效率。

而在AI寻找解题“灵感”的过程中,系统通过价值函数来模拟人类的数学审美。借助强化学习技术,系统内置的“价值模型”能实时预判每一条推理路径的潜力——不仅判断结论是否成立,更在乎推导过程是否简洁。

“当AI发现一个命题的证明难度显著高于其构建复杂度时,它便捕捉到了那一抹‘直觉性的灵感’。”论文第一作者、北京通用人工智能研究院研究员张驰说,这种“价值引导”能让模型从浩如烟海的空间组合中,精准捕捉到那些具备人类数学家审美标准的高质量题目,“实现了从‘模仿解题’到‘自主创造’的范式转变,这在国际上尚属首次。”

图为团队成员正在讨论算法设计的几何问题。新华社发

张驰介绍,通矩模型仅需单张消费级显卡即可在最多38分钟内解决2000年以来所有国际数学奥林匹克竞赛的几何难题。实验表明,其推理效率和准确率均达国际先进水平。

论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示,通矩模型的意义不仅在于解题速度的提升,更在于其通过模拟人类数学家的直觉和审美,实现了“小数据、大任务”的范式转化。

“这种不依赖海量标注数据、通过内部逻辑自我演化的路径,正是通用人工智能发展的关键。我们的系统不仅能与国际最先进的AI系统对标,更在理解逻辑底层美学和自主发现科学规律方面走在了前列。”他说。

据悉,目前,通矩模型自主生成的3道原创的几何新题,已入选2024年全国中学生数学联赛(北京赛区)。

张驰表示,这一成果为未来自动化数学证明、个性化智能教育及科学大模型的开发提供了技术支撑,有助于为更多感兴趣的青少年提供优质题目和讲解服务。未来,团队将继续深耕通用智能模型,推动中国人工智能技术在更多复杂逻辑与科学发现领域实现领跑。

大家都在看

  • 白玉京:马斯克画的是蓝图,还是大饼?

    白玉京:马斯克画的是蓝图,还是大饼? 【文/观察者网专栏作者 白玉京】 近日,蓝色起源新一代重型运载火箭在地面测试中发生爆炸,巨大的火球与滚滚浓烟很快登上全球社交媒体热搜。事故之后,美国国家航空航天局(NASA)局长艾萨克曼赶到爆炸现场。商业航 ... 机械之最06-12

  • 军营观察丨“山峰”组合成长记

    军营观察丨“山峰”组合成长记 初夏时节,渤海湾畔海风习习。海军某中心军士技能大师工作室内,三级军士长张庆山带着几名战友反复推敲装备维修革新方案,张庆山的徒弟、中士冯雪锋紧盯屏幕,一点点调试模块参数。张庆山和冯雪锋被战友们亲切地称为 ... 机械之最06-12

  • 回到物理学坐标上!培育钻石以极致导热,扛起AI芯片散热重任

    回到物理学坐标上!培育钻石以极致导热,扛起AI芯片散热重任 【环球网财经报道 记者 冯超男】谁也未曾料到,用来见证爱情的钻石,如今扛起了为 AI 芯片“退热”的重任。凭借着卓越的导热性,培育钻石,也就是人造金刚石,强势闯进了当下炙手可热的AI赛道。甚至,英伟达都亲自下 ... 机械之最06-12

  • 洗地机vs扫拖一体机器人vs吸尘器:2026三选一,按户型选不踩坑

    洗地机vs扫拖一体机器人vs吸尘器:2026三选一,按户型选不踩坑 谁家遇到干家务这事,真的都挺让人头疼的。虽然说现在清洁家电非常多,洗地机、扫拖机器人、无线吸尘器,但如何去用很多人也分不清,如果都买下来,价格起码也得1万往上并不便宜。很多人就是比较难分清楚区别,有的 ... 机械之最06-12

  • 关徽耀国门 实干淬担当——聆听他们守关强国的故事

    关徽耀国门 实干淬担当——聆听他们守关强国的故事 新华社北京6月11日电 题:关徽耀国门 实干淬担当——聆听他们守关强国的故事新华社记者邹多为当巨轮满载国货出海,当进口水果抢“鲜”入境,当走私违规无处遁形……货物贸易第一大国阔步向前的背后,饱含无数海关人 ... 机械之最06-12

  • 活力中国调研行丨“大脑秘境”如何让患者“遇见光”

    活力中国调研行丨“大脑秘境”如何让患者“遇见光” 大脑是人体最精密也最神秘的器官。夏日的午后,“活力中国调研行”记者团来到位于北京昌平的北京脑科学与类脑研究所。金色的阳光透过玻璃洒进实验室。一项项深耕脑科学前沿的探索正在持续推进并加快走进病房,为患者 ... 机械之最06-12

  • 扎根在一线  奋斗正当时(下)

    扎根在一线 奋斗正当时(下) 田野间的“天耕客”■ 杨 川 河北邯郸 新农人杨 川 金 立摄爷爷赶着黄牛耕田,爸爸开着拖拉机种地……大学毕业后,我把无人机带进田野,接过家里的“接力棒”,成了一名新时代“天耕客”。2002年,我出生在河北省邯 ... 机械之最06-11

  • 扎根基层 科技报国——央企青年代表共话使命担当

    扎根基层 科技报国——央企青年代表共话使命担当 新华社北京6月10日电 题:扎根基层 科技报国——央企青年代表共话使命担当新华社记者赵怡宁青年强,则国家强。在全面建设社会主义现代化国家新征程上,广大中央企业青年科技人才扎根一线、坚守岗位,用青春智慧服务 ... 机械之最06-11

  • 马钧:被低估的三国“机械天才”

    马钧:被低估的三国“机械天才” 如果说诸葛亮代表的是“谋略的顶峰”,那马钧代表的,就是三国时代另一种非常稀缺的能力:工程与机械创新。马钧这个名字,今天知道的人不多,但在古代技术史上,他其实是一个相当了不起的人物。他不是那种在战场上挥 ... 机械之最06-11

  • 钉钉歪了,阿里能一锤敲正吗?

    钉钉歪了,阿里能一锤敲正吗? 记者 钱玉娟在大搞组织变革与业务重组之后,阿里巴巴集团再度因其内部文化管理问题站上了舆论的风口浪尖。6月10日,阿里巴巴合伙人委员会罕见地在内网发布了一篇题为《有情有义有成长,才是阿里文化》的文章,直指钉 ... 机械之最06-11