全球最大!上海发布万亿参数科学大模型,国产算力筑底,数物化生“通吃”




科学智能(AI for Science)领域又迎来里程碑式的“上海时刻”。2月4日晚间,上海人工智能实验室宣布,开源全球首个基于“通专融合”架构的万亿参数科学多模态大模型——Intern(书生)-S1-Pro。这是全球开源社区中参数规模最大的科学模型,其性能表现稳居全球第一梯队,标志着科学智能正从“工具革命”的1.0时代,跨入由“革命性工具”驱动科学发现的2.0时代。
既见“沙粒”,亦见“沙丘”
在人工智能(AI)领域,模型的参数规模往往决定了其“脑容量”。此次发布的全新书生科学模型,总参数量达到惊人的1万亿(1T),刷新了行业纪录。然而可贵的是,如此巨大的参数规模,并没有让模型变得过分“笨重”。
据介绍,书生万亿科学大模型采用了创新的混合专家架构(MoE)。形象地说,其内部相当于有512位各领域“顶尖专家”坐镇,每当面对具体的科学问题,系统会精准调用最合适的8位“专家”,一起参与分析决策。这种“按需点将”机制,使这个万亿模型只需要激活大约2%的参数(220亿),就可以从容应对复杂数理逻辑推理。
更精妙的是,书生万亿科学大模型,还通过底层创新,使得模型实现了“物理直觉”的跨越。据介绍,相较于处理语言,AI模型在解决科学问题时会遭遇很多新的挑战。尤其是语言的“字符间距”、或者说“数据密度”相对稳定,但科学领域却绝非如此——天文学家们往往要从洪荒中努力捕捉极其渺茫的信号,而生命科学却往往能在一个实验里采集到百万级的数据。为此,上海人工智能实验室引入“傅里叶位置编码(FoPE)”并重构“时序编码器”,像是为大模型赋予了“双重听觉”——既可以在微观上感知单个音符,又可以在宏观上欣赏整个乐章;亦或者说,这种机制让模型也拥有了“双重视觉”,既可以直击“沙粒之棱角”,也能眺望“沙丘之绵延”。
根据上海人工智能实验室主任、首席科学家周伯文的构想:“通专结合”是实现通用人工智能(AGI)的可行方案。而此次开源的书生万亿科学大模型,实际上就通过一系列底层创新,为这一构想的落地提供了现实的路径。

书生万亿科学大模型界面。
能力横跨五大学科
基础层的创新,已经支撑书生万亿大模型在实战中初步显现出过人实力。可以说,它不仅能“解题”,更有潜力“解决问题”,提升科研生产力,并为前沿科学探索提供坚实支撑。
在国际数学奥林匹克(IMO-Answer-Bench)和国际物理奥林匹克(IPhO2025)两大权威基准测试中,书生万亿科学大模型让人看到了竞赛级别的解题能力。在科学智能的其他若干关键垂直领域,它同样表现出色;不仅是单学科成绩优异,更是在SciReasoner等高难度的综合学科评测基准中,取得了与顶尖的闭源商业大模型相当、甚至更优的成绩,稳居第一梯队。
总体上,书生万亿科学大模型已经成功构建了一个横跨化学、材料、生命、地球、物理等五大核心学科的全谱系能力矩阵,涵盖100多个专业子任务,可以在许多领域成为科学研究重要的贡献者。比如,它能精准解析复杂的分子结构图和各类实验图表;能够通过逻辑推理,开展理化性质预测,捕捉数据背后的因果规律等高阶科学活动。
未来,随着理解与推理能力的增强,该模型的“能力边界”还将进一步向真实的科研场景延伸。据上海AI实验室介绍,其应用范围将从微观的化学逆合成、蛋白质序列生成,拓展到宏观尺度的遥感图像分析等复杂任务。

书生万亿科学大模型在各评测基准中表现出色。
深度融入国产生态
大模型的应用成效,受制于算力、算法、数据等多维度因素。书生万亿大模型不仅有算法层突破,更在算力层面努力实现国产自主技术的全链路集成,以筑牢“算力-算法”的一体化基座。
据上海人工智能实验室介绍,在基础研究层面,他们借助“路由稠密估计”“分组路由”等策略,能像智能交通系统一样对海量的计算芯片负载进行均衡,再加上算法与系统的协同创新,从而攻克了超大规模模型训练在“学习效率”和“资源调度”上的核心瓶颈。
值得一提的是,在模型架构设计之初,上海人工智能实验室便与昇腾计算生态确立了联合研发路线,实现了从最底层的算子优化到上层的训练框架的深度适配。而在大规模训练中,研发团队攻克了精度对齐、硬件性能极致释放等一系列核心技术难题,结合先进的内存管理与并行策略,确保了万亿参数模型训练的高效与稳定。目前,研发团队还与另一家国产芯片代表企业沐曦开展了联合研发,为进一步构筑开放共享、面向未来的科学智能基础设施奠定了坚实基础。
据介绍,目前,包括大语言模型、多模态模型、强推理模型在内的书生系列大模型及全链路开发工具在内的开源体系,已吸引全球数十万开发者参与。下一步,上海人工智能实验室将持续推动全链条开源与免费商用,进一步降低全球科研门槛,与全球学术界和产业界一道,打造一个更开放、更高效且面向未来的科学人工智能生态。
大家都在看
-
2.78万平方公里海地,1187万人口95%为黑人,为何成“粪坑国家” 2024年3月,太子港的一座监狱被武装帮派攻破,四千多名囚犯一哄而散。帮派头目站在废墟前拍了张照片发到网上,笑得很开心。这座城市80%的街道,此刻都在这群人手里。这是加勒比海上一个面积不到三万平方公里的小国, ... 世界最长06-25
-
“史上最大”环太军演来了,“三军演”联动如何搅动亚太? 本周,多场大规模军事演习扎堆亚太。6月24日至7月31日,将持续月余的环太军演将在美国夏威夷群岛及周边海域举行,参演规模创下该军演55年历史新高。与此同时,美日“坚毅之龙”“英勇盾牌”两大联合军演同步在西太平 ... 世界最长06-25
-
杭州湾畔“双塔并立”,世界最长高铁跨海大桥有新进展 潮新闻客户端 记者 王凯艺 贺元凯 通讯员 王昊 程帅 摄6月24日下午,杭州湾跨海铁路大桥南航道桥再传捷报——159号主塔混凝土全部浇筑完成,顺利实现双塔封顶。这是继5月6日160号主塔封顶后的又一重要工程节点。 南 ... 世界最长06-25
-
世界最大的“岛国”澳大利亚,为什么还这么干旱满是沙漠? 澳大利亚,这个被大海四面环绕的大陆,却以其干旱的气候和广袤的沙漠而闻名于世。这个现象,不禁让人疑惑,为何在海洋的环抱之中,澳大利亚大陆却如此干旱? 我们需要了解澳大利亚大陆独特的地理位置和地形结构。它 ... 世界最长06-25
-
全球最大的电解铝企业是如何炼成的? 全球最大的电解铝生产企业是谁?提起全球最大的电解铝生产企业,你会想到哪家企业?是现代电解铝技术发明者美国人霍尔(Hall)和法国人埃鲁特(Herult)分别创立的美铝和法铝?亦或是中国的国家队主力中铝?还是被矿 ... 世界最长06-24
-
中国又干了件大事!世界最长跨海铁路大桥,让全世界闭嘴惊艳 6月21日,杭州湾跨海铁路大桥北航道桥9号主塔封顶。对于大多数人而言,这只是一个工程新闻中的一个句子,但是放在通苏嘉甬高铁这条线路上来看的话,这就代表着最困难的一个施工阶段向前迈进了一大步。该桥总长为29.2 ... 世界最长06-24
-
一架晴虹跨海通 杭州湾跨海铁路大桥中航道桥效果图。中铁大桥局 供图近日,在浙江省强潮海湾杭州湾的上方,一座世界长度最长、建设标准最高的高速铁路桥梁集群工程——杭州湾跨海铁路大桥正在建设当中。大桥八号墩主墩平台钢护筒插 ... 世界最长06-24
-
世界上最长摩托车——26米,得在湖边才能量 印度工匠Bharatsinh Parmar造出的这台车,全长26.29米,获得了吉尼斯世界纪录认证——比两节铰接巴士还长。评委当初甚至找不到足够长的平直硬化路面来量尺寸,最后把车开到湖边干滩上才完成测量。它是怎么不折断的? ... 世界最长06-24
-
全球最大打桩船“铁建大桥桩1”号在南通交付 建造海面上的“超级打桩机”(创新故事)李成义《人民日报》(2026年6月23日第6版)日前,由我国自主设计建造的全球最大打桩船“铁建大桥桩1”号在江苏南通正式交付。打桩船是专门用于水上桩基施工作业的特种工程船,就 ... 世界最长06-23
-
海南橡胶:全球橡胶巨头的“周期底牌” 在A股市场中,有一类公司天然带着“周期”的烙印——它们业绩波动剧烈,利润忽高忽低,股价长期处于“趴地板”状态,但每当行业景气度反转,其弹性又令人侧目。海南橡胶(601118)就是这样一个典型样本。作为全球最 ... 世界最长06-23
相关文章
- 全球最大打桩船“铁建大桥桩1”号在南通交付
- 海南橡胶:全球橡胶巨头的“周期底牌”
- 我国自研全球最大百兆瓦级高速电机在山东投用
- 全球最大!持续优化运行!
- 礼来30亿美元押注口服GLP-1本土化,剑指百亿减重市场
- 世界上只有中国湖北省武汉市才有的 全球独一无二的 5 大奇景
- 世界最长跨海铁路大桥主塔全部封顶
- 【基建突破】世界最长跨海铁路大桥主塔全面封顶
- 【富矿精开】铜仁首宗含钾砂页岩探矿权成功出让
- 创新创造活力迸发 发展动能持续释放
- 澳大利亚野心勃勃,打造二战后最大舰队,欲成军事强国,恐难如愿
- 新锦动力(300157.SZ):控股子公司新锦化机中标土库曼天然气国家公司燃气轮机维修项目,中标金额1500-2000万美元
- 生态环境部发布新规管控废电器回收处理污染
- 王莲新品种世界最大,叶片直径逾3米
- 钱塘江畔的它,穿上了“铠甲”!家门口的亚运场馆,上“新”了
- 史诗级暴跌!原油创史上最大单日盘中跌幅,标普500期货一度“跌停”
- SpaceX Colossus1配22万颗GPU,算力领先性体现在哪里
- 又下黑手!美国 FCC 直接禁了中国实验室,中方回应
- 世界防荒漠化日,人民日报讲了三个故事
- 出货第一却三年亏2亿:乐动机器人赴港IPO,面临毛利率大考
热门阅读
-
世界上最长的性行为 07-14
-
盘点一下世界之最,最长丁丁竟然有60㎝!! 04-20
