超越谷歌、微软!武汉大学又刷新一项世界纪录,相关水平全球领先!

发布者:贫在闹市 2023-3-9 18:58

人工智能自然语言处理模型要做的事情,即模拟日常生活中的各种场景来真正理解人类语言、文字的意义。此前,在公布的全球权威自然语言处理领域-复杂语言理解测试SuperGLUE 中,武汉大学-京东可信人工智能联合研究中心组成的梦之队参与其中,其提出的升级版织女模型Vega v2超越同场竞技的谷歌、微软、OpenAI等业界顶尖企业,以总平均分91.3分登顶SuperGLUE榜首,再次刷新复杂语言理解技术世界记录。

SuperGLUE成绩排名表

团队主要完成人员为武汉大学计算机学院钟起煌、京东探索研究院丁亮、武汉大学图像传播与印刷包装研究中心刘菊华、武汉大学计算机学院杜博、京东探索研究院、悉尼大学陶大程。

值得一提的是,测试中织女模型Vega v2在八个子任务中的四个单项任务,即自然语言推理任务CB(CommitmentBank)、文本蕴含任务RTE(Recognizing Textual Entailment)、因果推理任务COPA(Choice of Plausible Alternatives)和指代消解任务WSC(Winograd Schema Challenge)中均位列第一。相关负责人表示,织女模型Vega v2凭借60亿参数量规模大幅超过谷歌提出的5400亿超大模型PaLM的复杂语言理解性能,充分证明了武汉大学-京东可信人工智能联合研究中心自然语言理解技术水平在超级深度学习领域的全球领先地位。

SuperGLUE任务功能展示

织女模型Vega v2是在此前提出的模型Vega v1(15亿参数,GLUE榜单冠军)的基础上进行升级,规模更大、性能更强。不同于一味地扩大模型规模,Vega v2更采用了一种高效的自进化学习方法,充分挖掘预训练数据中蕴含的语义知识,以进一步激发模型自然语言理解性能,从而在有限的模型规模下即可训练得到高性能语言模型。此外,为了实现模型的快速部署,团队还针对大规模语言模型提出了一种基于知识蒸馏的提示学习算法,仅更新额外的5%模型参数即可实现大模型的有效任务迁移。

Vega v2模型训练方法

人工智能是引领未来的国家战略技术,也是新一轮产业变革的核心驱动力、国际竞争的新焦点和经济发展的新引擎,在国家科技规划中占据着极为重要的地位。

武汉大学人工智能学科历史源远流长,学校是全国最早开展人工智能研究的单位之一。

近年来,武汉大学更是在人工智能领域持续发力。2019年,学校整合综合学科优势,依托计算机学院,联合全校18个院部,以跨学科多元交叉为特色,成立了人工智能研究院,攻关人工智能重大基础理论难题和“卡脖子”技术问题,培育人工智能核心竞争力,产出了一系列成果。

此次获奖团队所在的武汉大学-京东可信人工智能联合研究中心成立于2021年,是由武汉大学计算机学院与京东联合成立的科研机构。该中心以从基础理论层面实现颠覆式创新为目标,共同开展科学研究与人才培养,研究领域包括可信人工智能、量子机器学习、超级深度学习及其他人工智能涉及的理论与技术。自成立以来,联合研究中心已累计发表SCI一区/CCF A类期刊或会议等高水平研究论文40余篇,并在ICCV2021多目标跟踪竞赛的深度+视频大赛与全球自然语言处理领域顶级测试GLUE大赛中取得世界第一的佳绩。

发展人工智能,人才培养同样是重中之重。2020年,武汉大学获批人工智能本科专业,由学校计算机学院长期从事人工智能理论研究和技术创新的教师成立了人工智能系,是全国首批建设人工智能一级学科的单位,也是全国首批具有人工智能“本-硕-博”贯通培养能力的单位。

长期以来,武汉大学人工智能系培养的学生具有一流的综合素质、优良的道德修养、扎实的理论基础、较强的关键技术创新能力和系统设计能力,是社会急需的复合型高水平人工智能人才。

面向未来,武汉大学将继续发力,争取在人才培养、科技创新、社会服务和国际交流合作等方面发挥更大作为,为国家新一代人工智能发展计划做出卓越贡献。

更多精彩资讯,欢迎关注头条号:武汉大学招生办公室

注:文章部分素材来源于武汉大学新闻网,珞珈计科先锋,软科

大家都在看

返回顶部