中国已有79个10亿参数大模型,业界呼吁尽快建立自主创新“护城河”

发布者:穿越激流的人 2023-6-1 03:24

“据不完全统计,中国10亿以上参数规模的大模型已经发布了79个,从地区来看北京和广东最多,自然语言处理是大模型研发最活跃的领域。”在中关村论坛上,中国科学技术信息研究所所长,科技部新一代人工智能发展研究中心主任赵志耕披露了中国人工智能大模型的情况。

今天人工智能领域的竞争比以往任何时候都更加激烈。有人把近日扎堆的大模型创业称作“百模大战”,从百度文心一言、阿里通义千问到商汤、昆仑万维等推出大模型,到王小川的百川智能、王慧文的光年之外、李志飞的序列猴子等,“中国版ChatGPT”在近几个月里几乎迎来扎堆发布的热潮。而在大模型的应用层,已有包括在线办公、金融科技、在线教育等多个细分垂直领域公布了大模型领域进展。

创新工场董事长、首席执行官李开复在论坛演讲中表示,AI大模型是一个绝对不能错过的历史机遇, AI大模型已经慢慢走向实体经济,它会改写每一个应用,重构人类的工作,很多重复性的劳动会被取代。

论坛过后,有参会嘉宾被记者问到如何看待如火如荼的大模型创业潮时,评价“这说明中国企业非常热情”,又补充一句:“像在炼丹。”

北京、广东大模型数量最多

赵志耕表示,从全球大模型发展态势来看,美国谷歌、OpenAI等机构不断引领大模型前沿的技术方向,同时欧洲、俄罗斯、以色列等越来越多的研发团队也在加入到大模型的研发中。

从全球已经发布的大模型分布来看,中国和美国超过全球总数的80%,美国在大模型数量上居全球之首,中国从2020年进入大模型快速发展期,目前与美国保持同步增长态势。

根据中关村论坛上发布的《中国人工智能大模型地图研究报告》,中国人工智能大模型的地域分布有明显特点,14个省市地区都有开展大模型研究,其中北京和广东最多,北京有38个大模型,广东有20个大模型。

在模型领域分布上,自然语言处理仍是目前大模型研发最活跃的重点领域,其次是多模态领域。计算机视觉和智能语音等领域仍有待进一步突破,目前模型较少。

如果把大模型的生成式AI诞生过程比作“炼丹”,那么作为GPU的算力就好比炼丹炉下燃烧的烈火。报告通过调研全国范围内的算力基础设施分布情况发现,北京、广东、浙江、上海等地的大模型数量最多,同时这4个地方也是近三年人工智能服务器采购数量最高的地区,表现出非常明显的强相关性,为大模型研发应用提供了重要支撑。

在发表相关论文方面,中国大模型通过学术论文发表方式已经形成一定学术影响力。其中北京、广东、上海三地无论是论文发表量还是引用量都居国内前列,体现出明显的人才储备优势,江苏、广东、上海也是大模型人才相对较多的地区。

开源创新生态方面,目前已经有超过半数大模型实现开源。北京、广东、上海三地开源数量和开源影响力均居国内前三,这背后主要是高校和机构在推动,如清华大学的ChatGLM-6B、复旦大学的MOSS以及百度的文心系列大模型开源等。

大模型人才稀缺、原始创新不足

人才为大模型研发提供关键智力要素支撑。但从数量上看,目前各地大模型人才总量仍然稀缺,数量均不充足。

李开复在谈到当前AI大模型面临的挑战时,提到包括需要质量更高的数据、需要更多的AI工程师与AI科学家等。

此前拉勾招聘发布的《2023第一季度AIGC人才供需报告》显示,2023年第一季度,AIGC人才招聘需求连续三月攀升,今年3月AIGC人才岗位需求量环比增加42%。在招聘平台上,不少企业甚至开出百万年薪以抢夺AI技术人才。

而中国的大模型自身也需要不断打磨。在推动开源开放的同时,多位业内人士都提到中国还需要加强基础研究,“自主创新是发展大模型的必经之路。”

李开复提到,要支持开源,但中国大模型公司不能过度依赖开源模型。“需要尽快建立自己的IP(知识产权)和技术优势,形成护城河。”因为开源模型无法达到国外大厂自研模型的性能,它的能力会成为“天花板”;同时海外大厂的开源技术还有关闭风险。而且,由于国内外文化、用户习惯和法律法规不同,将在国外训练好的模型带到国内进行微调是存在风险的。

中国工程院院士戴琼海也表示,目前我国人工智能领域应用强,但原始创新不足,在基础性技术和人才方面与美国相比处于弱势。戴琼海建议,我国应从政策、机制和投入上深化人工智能的人才培养和基础研究,强化原始创新。

此外,尽管国内大学、科研机构、企业等不同创新主体都在积极参与大模型研发,但学术界与产业界之间的联合开发相对较少。赵志耕提到,“我们观察到合作收缩趋势,这是接下来需要注意的。”

她建议,要加强资源和研发力量的统筹,促进大模型的有序发展, 例如加强智算中心、超算中心、云计算中心等计算资源的统筹。与此同时,加快基础研究和技术创新,提升学术和开源影响力。

她还强调了强化国际合作,积极参与全球人工智能治理的重要性。各国对于AIGC合规性的重视正在推动相应的监管措施出台。今年4月中国国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》。赵志耕表示,希望这些治理原则和伦理规范能够在大模型的全链条中落地生根。在增进共识的基础上,加强人工治理的全球合作,创造中国的智慧和治理方案。有从业者指出,要参与规则的制定,中国的大模型要先上牌桌,才能拥有话语权,才有全球竞赛的入场券。

大家都在看

  • 我国公认的10大矿泉水品牌,认准再买不踩坑

    我国公认的10大矿泉水品牌,认准再买不踩坑 每天都要喝水,但你真的会选矿泉水吗?走进超市,货架上的瓶装水五花八门,价格从1块到十几块不等。很多人拿起就拿,根本分不清矿泉水、纯净水和天然水的区别。花高价买的可能只是普通纯净水,想喝好水却总踩坑。喝 ... 中国十大06-15

  • 桃饱人杏伤人?中国10大神仙杏爆汁,哪口是你回不去的童年!

    桃饱人杏伤人?中国10大神仙杏爆汁,哪口是你回不去的童年! 祖宗传下老话“桃饱人,杏伤人”。此言非虚!甜杏仁润肺止咳,苦杏仁暗藏氰化物,贪嘴真会要命。《齐民要术》早留锦囊,鲜果难存,曝晒封存方留夏日余甜。三国董奉悬壶济世不收分文,唯求愈者种杏,数载成林,以杏换 ... 中国十大06-15

  • 中国十大文旅城市

    中国十大文旅城市 根据综合文旅资源、游客热度及体验多样性等因素,以下是被广泛认为具有代表性的#中国十大文旅城市# :我的喜好排序是……No.1三亚 地域情节(亲戚最多的城市)热带海滨度假天花板,亚龙湾、海棠湾、天涯海角坐拥碧海 ... 中国十大06-15

  • 40年前全民票选!中国十大风景名胜,每一个都是天花板

    40年前全民票选!中国十大风景名胜,每一个都是天花板 如今文旅榜单层出不穷,网红景点轮番出圈,热度来得快去得也快。但很少有人知道,在1985年,《中国旅游报》发起了一场覆盖全国的全民投票评选,没有资本造势、没有流量营销,全靠普通老百姓实打实投票,选出了公认的 ... 中国十大06-14

  • 中国‖十大超级工程

    中国‖十大超级工程 中国十大超级工程”并没有官方固定的统一名单,不同视角、战略意义、工程难度、年度盘点等会选出不同的项目。以下是综合多家权威报道后,最具代表性的十大超级工程(排名不分先后,2025年)1️⃣青藏铁路青藏铁路( ... 中国十大06-12

  • 中国10大濒危景点!再不去就看不到了

    中国10大濒危景点!再不去就看不到了 冰箱家家都有,但打开方式千差万别。十个老人里,七八个把热菜直接塞进去,还纳闷为啥电费蹭蹭涨。我家对门老张上个月修冰箱花了三百来块,师傅一打开门就摇头——冷凝管结的冰比拳头还厚。说实话,冰箱门上的鸡蛋格 ... 中国十大06-12

  • 盘点中国十大“被名字耽误”的地方宝藏美食!

    盘点中国十大“被名字耽误”的地方宝藏美食! “老板,来一份苍蝇头!”“什么???”“再来一盘蛤蟆吐蜜!外加一杯臭屁醋!”你以为是恐怖片现场?不,这是资深吃货的点单日常。在中国美食界,有一批被名字耽误的宝藏美食!今天,我们就来盘点十大“名不副实” ... 中国十大06-11

  • 2025中国十大科技突破重排:只看谁最能改变普通人日常

    2025中国十大科技突破重排:只看谁最能改变普通人日常 两院院士评选的2025中国十大科技进展早已出炉,人造太阳、DeepSeek大模型、脑机接口等重磅成果悉数上榜。榜单头部成果刷屏各大媒体,看似声势浩大,可如果以对普通人生活的实际影响为标尺重新排序,名次会彻底颠覆。 ... 中国十大06-11

  • 我国公认的食用油 “10 大品牌”,认准再买错不了,你知道几个

    我国公认的食用油 “10 大品牌”,认准再买错不了,你知道几个 很少有一个厨房日常,会像“买油”这件小事一样,折射出中国家庭的生活观。瓶瓶罐罐摆在货架上,看似普通,其实背后是一场关于健康、信任与选择的博弈。如今,市场上的油早已不止是“花生油”“菜籽油”那么简单,从 ... 中国十大06-11

  • 买油别踩坑!国内公认10大品牌盘点告别劣质油!

    买油别踩坑!国内公认10大品牌盘点告别劣质油! 俗话说“开门七件事,柴米油盐酱醋茶”,这居家过日子,谁能离得开油?可你逛超市的时候,是不是也只盯着价签看,哪个搞促销就往购物车里塞?结果呢,下锅一炒浓烟滚滚,呛得直咳嗽,炒出来的菜不仅没点油香,甚至还 ... 中国十大06-11