可“解难题”也可“出好题”!中国科学家取得通用人工智能逻辑推理新突破
新华社北京1月26日电(记者魏梦佳)中国科研团队近日自主研发出的一款“通矩模型”,该成果26日晚在线发表于国际权威学术期刊《自然-机器智能》。相关专家表示,这是国际首个同时具备自主出题和自动解题双重能力的通用人工智能系统,标志着中国科研团队在自动化推理的逻辑核心领域实现关键技术自研,并在性能与功能多样性上达到国际领先水平。
据了解,长期以来,AI在逻辑推理领域面临着两大核心挑战:一是“组合爆炸”,即几何推理往往需要寻找并添加精妙的辅助线,每增加一个点或圆,搜索空间(即探索模型中所有可能的解决方案)都会呈指数级增长;二是“高质量数据匮乏”,即现有的几何题目库规模较小,难以支持大规模模型的训练。
由北京通用人工智能研究院、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院以及北京大学武汉人工智能研究院组成的联合科研团队,通过开发一套精密的逻辑推理搜索架构,将复杂的几何世界抽象建模,使AI系统能像人类数学家一样,在逻辑推理每个节点上都能进行有序地系统性探索,避免了无效的重复尝试。
据悉,团队创新性地引入了“规范化表示”技术。这套机制赋予了AI一种“识破伪装”的能力:在复杂的几何空间中,同一个命题往往会因为图形的旋转、翻转或缩放而产生无数种表现形式。通矩模型能自动识别并合并这些对称或同构的拓扑结构,将庞杂的搜索空间压缩了几个数量级。例如,无论一个三角形在空间中如何摆放,系统都能精准锁定其本质的几何关系。这种对物理对称性的深度利用,极大地提升了搜索效率。
而在AI寻找解题“灵感”的过程中,系统通过价值函数来模拟人类的数学审美。借助强化学习技术,系统内置的“价值模型”能实时预判每一条推理路径的潜力——不仅判断结论是否成立,更在乎推导过程是否简洁。
“当AI发现一个命题的证明难度显著高于其构建复杂度时,它便捕捉到了那一抹‘直觉性的灵感’。”论文第一作者、北京通用人工智能研究院研究员张驰说,这种“价值引导”能让模型从浩如烟海的空间组合中,精准捕捉到那些具备人类数学家审美标准的高质量题目,“实现了从‘模仿解题’到‘自主创造’的范式转变,这在国际上尚属首次。”

图为团队成员正在讨论算法设计的几何问题。新华社发
张驰介绍,通矩模型仅需单张消费级显卡即可在最多38分钟内解决2000年以来所有国际数学奥林匹克竞赛的几何难题。实验表明,其推理效率和准确率均达国际先进水平。
论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示,通矩模型的意义不仅在于解题速度的提升,更在于其通过模拟人类数学家的直觉和审美,实现了“小数据、大任务”的范式转化。
“这种不依赖海量标注数据、通过内部逻辑自我演化的路径,正是通用人工智能发展的关键。我们的系统不仅能与国际最先进的AI系统对标,更在理解逻辑底层美学和自主发现科学规律方面走在了前列。”他说。
据悉,目前,通矩模型自主生成的3道原创的几何新题,已入选2024年全国中学生数学联赛(北京赛区)。
张驰表示,这一成果为未来自动化数学证明、个性化智能教育及科学大模型的开发提供了技术支撑,有助于为更多感兴趣的青少年提供优质题目和讲解服务。未来,团队将继续深耕通用智能模型,推动中国人工智能技术在更多复杂逻辑与科学发现领域实现领跑。
大家都在看
-
金属材料及热处理基础:盘点7个力学性能关键指标,从原理到应用 在机械制造领域,黑色金属材料的应用占比超 90%,核心原因就是它具备可通过热处理灵活调控、能适配各类复杂工况的力学性能。不管是零件设计选材、热处理工艺制定,还是后期的失效分析,吃透力学性能指标都是绕不开的 ... 机械之最04-27
-
国内史诗级长途自驾,3 万公里跨越南北西东,108 天走完直呼过瘾! 当夕阳把最后一抹金辉洒在帕米尔高原的雪峰上,当车轮碾过东极抚远凌晨四点的第一缕晨光,你会突然明白——有些风景,注定属于那些把梦想刻进车轮的人。这不是一场旅行,这是一次对960万平方公里的致敬。108天,3500 ... 机械之最04-27
-
万亿级大风口!超大“机”遇,来了→ “十五五”规划纲要,将“量子科技、生物制造、氢能和核聚变能、脑机接口、具身智能、第六代移动通信”列为六大未来产业,推动其成为新的经济增长点。具身智能是指拥有物理身体的智能体,人形机器人就是典型的代表之 ... 机械之最04-27
-
机械五虎VS机械四小龙完整版对比!2026报考直接对照选 机械五虎VS机械四小龙完整版对比!分数档位+专业侧重+就业差异,2026报考直接对照选 开篇导语 工科机械报考最纠结:选机械五虎冲顶尖天花板,还是选机械四小龙走高性价比赛道?一份完整版对比表,把分数门槛、王牌特 ... 机械之最04-27
-
首席记者谈首季经济丨江西的新能源产业突围之路 新华社南昌4月26日电 题:江西的新能源产业突围之路新华社记者冯俊扬地处江西上饶的晶科能源股份有限公司稳居全球光伏组件出货量前列;刷新充电速度纪录的比亚迪新一代刀片电池在江西抚州量产……今年1-2月,江西光 ... 机械之最04-27
-
0博士组合拿下ICLR时间检验奖,十年论文终封神 鹭羽 发自 凹非寺量子位 | 公众号 QbitAIICLR 2026时间检验奖新鲜出炉,获奖者——GPT天才本科生Alec Radford。网友们纷纷送来祝贺:“实至名归!”Alec为人相当低调,其社媒清一水的都是转发推荐他人优秀成果。但实 ... 机械之最04-26
-
追光丨专属老年人的“神仙”健身房 你看了“心动”吗? 放眼全国大大小小的健身房早就遍地开花但专门给老年人开的健身房你见过吗?不是公园随便甩甩手也不是小区慢悠悠走两圈而是有专业设备、有运动方案、有指导人员的专业空间一进门先做“全身扫描”↓机器一测个性化运动 ... 机械之最04-26
-
2026北京车展,中国智驾正定义全球标准 编者的话:在全球汽车产业的重心开始向东方倾斜之际,一场规模空前的行业盛宴在北京启幕。4月24日至5月3日,2026北京国际汽车展览会以“世界最大规模车展”的姿态,为全球观众和展商展示汽车技术创新的高地。正如一 ... 机械之最04-26
-
关注“体验经济”丨每年十几万人打卡“小米工厂” 工业游何以这么火? 新华社北京4月25日电 题:每年十几万人打卡“小米工厂” 工业游何以这么火?新华社记者吉宁看流水线上的机械手臂上下挥舞,亲手触摸机械零件实物,一趟行程下来仿佛置身科幻大片,近距离感受中国制造的魅力……近一 ... 机械之最04-26
-
机械键盘选购指南:不同预算怎么选,才能不踩坑? 2026实战版买机械键盘踩坑的人,不是因为买贵了,而是买错了。有人花800块买青轴,室友差点搬家。有人冲着"磁轴"跟风,到手才发现自己根本不需要那么高的触发精度。键盘看着就是一块板子加一堆键帽。但选错 ... 机械之最04-26
相关文章
- 关注“体验经济”丨每年十几万人打卡“小米工厂” 工业游何以这么火?
- 机械键盘选购指南:不同预算怎么选,才能不踩坑?
- 机械设计“进化史”从古代水车到智能机器人,藏着人类的造物智慧
- 机械专业报考建议:在质疑声中看清“工业之母”的真正价值
- 星箭聚力 探秘海南超级工厂
- 一场田间的“精密大考”——天津“优机优补”赋能合作经济一线观察
- 半夜收到一条私信:陈老师,我家孩子985机械电子,校招月薪5500
- 仅次于东道主!约700家中国展商亮相汉诺威工博会
- 央视曝光全球最强光刻机:西方封锁十年,中国早已另起炉灶
- 工业母机的“两岸配方”
- 机械大学生能考哪些证书?2026年高质量就业考证指南与职业规划
- 被机械设计“拯救”的3个日常瞬间,原来它一直在默默帮我们省事
- 为沙漠钉“楔子”——千里河西治沙行
- 商业航天,加速“飞天”(大数据观察·航天日特别报道)
- 毫秒级精准复刻人类动作——人形机器人有了“通用小脑”
- 高考填志愿:机械类这三个专业怎么选?看完这篇不再纠结
- 爷爷的老座钟,藏着机械设计的“老智慧”,用了50年还在走
- 从“仰望星空”到“产业升空”——解码商业航天的中国式强国之路
- 统一后的台湾机械厂是沦为平庸还是涨薪?解析两岸合并后的红利!
- 五十年代尚无人工智能,毛主席早已提出机器替代人脑劳动
热门阅读
-
天下第一暗器暴雨梨花针,传说中的唐门暗器做出来了 07-13
-
汽车投诉排行榜前十名汽车 问题最多的就是这些车 07-13
-
世界上最牛挖掘机,甚至可以挖穿一座城市 11-05
-
世界最大核潜艇制造厂,产量远超中美法 11-20
