对话松下康之:以具身智能突破AI与物理世界的边界
2024年10月,松下康之(Yasuyuki Matsushita)博士在离开近十年之后重返微软亚洲研究院。再次加入,松下康之有了一个全新的身份——微软亚洲研究院(东京)负责人。在此之前,他曾于2003年至2015年间在微软亚洲研究院任职,主要研究方向包括计算机视觉、机器学习和优化等,随后他转赴大阪大学担任教授。
作为微软研究院全球化战略的一部分,微软亚洲研究院东京实验室的成立将进一步巩固微软研究院在亚太地区的科研投入。为此,我们与松下康之进行了一次深入的对话,回顾了他的职业生涯,探讨了科学技术的发展演变,并展望了微软亚洲研究院(东京)令人期待的新机遇。
微软亚洲研究院(东京)负责人松下康之(Yasuyuki Matsushita)博士
重返微软亚洲研究院
Q:欢迎您回到微软亚洲研究院,并肩负起建设东京实验室的重任。您曾在微软亚洲研究院的北京实验室工作了十二年,之后又转战学术界担任教授。是什么促使您在十年后选择回归微软亚洲研究院?
松下康之:微软亚洲研究院一直走在科学研究的最前沿,特别是在当前的人工智能时代。今年初,我得知了研究院计划扩展其研究网络,包括在东京设立新的实验室,这对我来说是一个令人激动的新机遇,让我有机会在本地进行具有深远影响的研究,也能在国际舞台上施展才干。而且,微软在人工智能领域处于领先地位,这也是我重新参与其中的一个最佳时机。
我相信,在微软亚洲研究院这个世界级的科研平台上,我能够为人工智能这个蓬勃发展的领域注入新的能量。参与到人工智能的发展中并贡献一份力量,也让我感到倍感兴奋。
微软亚洲研究院过去十年的变与不变
Q:在回来的这一个多月里,从您的角度看,过去十年微软亚洲研究院有哪些变与不变?
松下康之:一个最直接的感受就是员工使用的工具和资源有了显著的变化。我目前还在熟悉这些先进的数字化系统,它们极大地提高了我们的工作效率,并促进了团队间的协作。这十年间,微软不仅推动了其他公司的数字化转型,自身也经历了深刻的变革。
除此之外,微软亚洲研究院的许多独特之处依然如故,比如持续为人才的成长营造创新和协作的文化与环境。研究院始终拥有并吸引着对科学研究充满热情的优秀人才。微软亚洲研究院最大的优势之一就是开放与协作的精神,这一点在和众多高校与研究机构建立的长期合作伙伴关系中也得到了体现。这种合作促进了跨地区、跨文化和跨学科的交流,激发了创新,并推动了产业的发展。对卓越的不懈追求一直是微软亚洲研究院的核心特质,这一点始终未变。
对微软亚洲研究院(东京)的规划
Q:随着微软亚洲研究院在温哥华、东京、新加坡和香港等地区的扩展,您作为微软亚洲研究院(东京)的负责人对东京实验室有哪些规划?微软亚洲研究院(东京)的建立将如何为亚太地区的创新生态做出贡献?
松下康之:当前我的首要任务是确保东京实验室的发展与微软研究院的使命保持一致,即推动科学技术的进步,造福人类。东京实验室的研究将与日本社会经济发展的重点相契合,并特别关注具身智能(embodied AI)、社会福祉与神经科学、社会责任人工智能(societal AI),以及产业创新等领域。这些领域的研究工作旨在解决当前社会面临的紧迫挑战,并将推动人工智能技术的发展,使其惠及整个社会。
我们始终坚持开放的研究实践,通过发布并开源研究成果和工具,我们希望我们的工作能够使更广泛的行业从中受益,并为丰富全球知识库做出贡献。我们的目标是分享那些能够推动全社会进步和创新的深刻见解。
加速下一代人才成长
Q:人才成长与发展是微软研究院使命与文化的核心。微软亚洲研究院(东京)正在寻找具备哪些特质的人才?东京实验室将如何加大力度培养下一代科技创新人才?
松下康之:作为微软的一部分,我们的关键优势在于能够将研究与现实世界的应用紧密结合。这种研究与实践的桥梁可以确保我们的技术创新能够带来更加有意义且有益的成果,直接影响社会发展。
在招募新人时,我们寻找的是具有自驱力、强烈好奇心以及对解决社会挑战充满热情的伙伴。对复杂问题背后的“为什么”有强烈的求知欲是我们最看重的特质之一。虽然技术专长至关重要,但我们相信,致力于解决社会问题可以激发更多创造力并促进更多有意义的进步。而这种好奇心和使命感的结合更能激发创新,并推动微软亚洲研究院向前发展。
培养下一代科技创新人才也是微软亚洲研究院(东京)的核心愿景之一。我们将延续微软亚洲研究院过往成功孵化的人才培养项目,包括联合研究计划、访问学者项目和实习生项目等。这些项目为青年研究人员和学生提供了宝贵的实践经验,能够帮助他们掌握必要的科研技能,加深对复杂技术挑战的理解。
我们致力于营造一个有利于人才成长、协同合作并为全球科技发展做出贡献的科研环境。通过将技术创新与现实世界的需求紧密结合,我们希望可以激励新一代人才不断突破极限,推动社会进步。
计算机视觉领域的快速发展
Q:十年前您主要专注于光度学和视频分析领域的研究,能否分享一些当时的关键成果?您认为像人工智能这样的新兴技术对计算机视觉领域有什么影响?
松下康之:十年前我的研究重点集中在计算机视觉领域,特别是用于三维(3D)重建的光度学和提升视频质量的视频分析。在那个时期一个比较有影响力的项目是我们开发了一台能够捕捉高分辨率 3D 信息的十亿级像素相机。这台相机在敦煌莫高窟的文化保护中发挥了重要作用,它以前所未有的精度对敦煌壁画和佛像等文化遗产进行数字化保护。
另一个值得一提的项目是视频稳定技术,该技术作为媒体基础的一部分被集成到了 Windows 7 操作系统中。这项技术通过校正不必要的相机抖动提升了视频质量,实现了更流畅、专业的视频输出效果。在当时,能够实时处理并提升视频稳定性的算法是一项具有开创性的研究进展。
此后,深度学习、大规模数据集和复杂的神经网络架构的引入将计算机视觉推向了新的高度。曾经我们认为困难的任务,如目标检测、识别和分割,现在借助人工智能技术已经变得司空见惯。网络架构、学习策略的持续创新,以及增强的数据集,正在进一步拓展科学技术的边界。当前,一个令人兴奋的趋势是人工智能在现实世界交互场景中的应用,而这催生了具身智能这一新兴的研究领域,这也是我目前工作的一个重点。
理解具身智能:超越机器人技术
Q:您目前的研究方向主要是具身智能,那么请问具身智能是什么?它与我们熟悉的机器人技术有何不同?
松下康之:具身智能超越了传统机器人技术的范畴。机器人通常配有执行器,专门设计来完成特定的任务,而具身智能则侧重于开发能够执行复杂任务并在物理和虚拟环境中理解和交互的智能系统。过去,机器人技术和人工智能是两个相对独立的领域。具身智能则是这两个领域的融合,它可以将人工智能技术与能够在真实世界中感知、行动和学习的物理实体集成在一起。
本质上,具身智能是一个跨学科领域,它涉及机器人控制、强化学习、空间感知、人机交互和推理等多个方面。例如,具身智能拥有推断因果关系的能力,可以理解没有支撑的笔记本电脑会因重力而坠落。这种交互和认知能力源于对物理世界的接触和理解,因此,具身智能是一个令人兴奋且多面的研究领域。
正是由于具身智能的高度复杂性,没有任何单一组织能够独自覆盖其发展的所有方面。我们非常期望与工业界和学术机构合作,通过结合他们的专业知识和我们在人工智能领域的优势,共同推动具身智能领域的发展。
给计算机视觉与人工智能年轻科研人的建议
Q:您在学术界和工业界都有着深厚的研究经验。以教育者和科研人的双重身份,您对那些有志于投身于计算机视觉和人工智能研究的年轻人有什么建议?
松下康之:对于想要从事计算机视觉和人工智能领域研究的年轻人来说,扎实的数学基础和计算机科学知识是必不可少的。即使在研究课题与技术演进日新月异的今天,这些核心技能依然至关重要,例如对梯度、雅可比矩阵和向量空间等基础数学概念的深刻理解。掌握了这些原理,无论编程语言还是开发平台如何更迭,你都能游刃有余。
另外,持续学习的能力同样不可或缺,因为研究领域时刻都在发生变化。十年前,深度学习远不如今天这样重要,但现在它已经成为人工智能领域的基石。微软特别强调培养成长型思维,即要灵活适应变化、对新技术持开放态度,并随着行业的发展不断调整。新入行的研究者需要培养快速掌握新技能的能力,同时不断巩固基础知识,这种适应能力是在科研领域长期发展和取得成功的关键。
欲了解微软亚洲研究院(东京)更多详情,请点击:
https://www.microsoft.com/en-us/research/group/microsoft-research-asia-tokyo/
大家都在看
-
AI眼镜爆发的真相:购买容易配镜难,线下渠道成了“最后一公里” 日前,智能眼镜鼻祖谷歌在Google Glass面世13年后,再度入局智能眼镜赛道。在一次小型活动上,谷歌展示了与XREAL合作开发的Project Aura。这款全球首款搭载Android XR平台以及Gemini AI的消费级AR眼镜产品,将于2026 ... 科技之最12-10
-
创新开放,倪飞回应豆包手机,句句都在向行业“开枪” 最近,努比亚 M153成为了科技行业最轰动的产品,更多的人习惯叫它豆包手机。自12月1日发布起,这款手机带着巨大的流量席卷各大平台。一时间各路大佬评论站台,极客们求F码。各家APP也反应不一。图片来源:豆包手机助 ... 科技之最12-10
-
黄仁勋语出惊人!CPU将成时代弃儿,英伟达靠GPU制霸未来? 日前美国政府宣布,将允许英伟达向中国和其他地区的“获准客户”销售其H200人工智能芯片,条件是美国政府将获得英伟达在这些地区H200销售额的 25% 的分成。GPU计算再度受到关注。就在前几天,黄仁勋在一场公开活动上 ... 科技之最12-10
-
在潮汕,撕开一条科技的“缝” (来源:硅星人)人工智能、大模型、极客精神,这些词离人们印象中的“潮汕”很远。传统大家族、经商头脑,乃至手打牛肉丸和牛肉火锅,似乎都更声名在外。“潮汕”与“科技”,向来不常被联系到一起。然而在沉默跋涉 ... 科技之最12-09
-
谷歌HOPE架构来了!突破大模型长期记忆难题,智能体要爆发? 日前,Google在其发布的论文《Nested Learning: The Illusion of Deep Learning Architectures》中,提出了一个名为 HOPE 的新框架试图解决大模型长期记忆的问题。这一架构备受关注,因为长期记忆一直困扰着大模型的 ... 科技之最12-09
-
2025自主五常冰与火之歌:比亚迪赢麻,但吉利才是大赢家? 2025年即将结束,中国车市在新能源渗透率突破50%的里程碑后,并未迎来预期中的狂欢,反而进入了一场更为残酷的中场清算。补贴退坡、资本冷静、市场从增量转向存量,过去靠速度掩盖的问题,今年悉数摆上了桌面。自主 ... 科技之最12-09
-
金石为开:中华文明的铜筋铁骨 在文明的长河中,金属,是定义时代的材料。它深藏于大地,却具备顺从人意、可熔可铸的秉性。从青铜铸就的礼乐重器,到钢铁铸造的帝国基石,金属的变革之力,深刻塑造了中华文明的进程。系列科学文化纪录片《格物志: ... 科技之最12-08
-
一加Ace 6T 24小时极限挑战:我能把这块8300mAh电池用光吗? 啧啧,这2025年的一加,真有点高产似那啥。仔细想来,去年全年,一加也就发布了4-5款产品。结果到了今年,单论上半年发布的产品就不止这个数,进入下半年后,10月底就发布了搭载最新旗舰第五代骁龙8至尊版的一加15, ... 科技之最12-08
-
易经藏玄机,科学奔赴的未来,竟是“神之境” 当科学撕开宇宙的一角,我们窥见的,是理性的边疆,还是神性的开端?几千年前,《易经》以阴阳八卦推演天地玄机,预言着万物变化的规律;今天,当科学家们以基因编辑改写生命密码,用纳米机器巡游人体血管时,我们突 ... 科技之最12-08
-
阿基米德:古希腊的力学之父,开启科学的黄金时代 在漫长的人类历史长河中,有一些伟大的科学家,他们的思想和发明不仅改变了当时的世界,更为后世的科技发展奠定了坚实的基础。古希腊的阿基米德,便是其中最璀璨的一颗明星。他被誉为“力学之父”,不仅在静力学和流 ... 科技之最12-08
相关文章
- 2025自主五常冰与火之歌:比亚迪赢麻,但吉利才是大赢家?
- 金石为开:中华文明的铜筋铁骨
- 一加Ace 6T 24小时极限挑战:我能把这块8300mAh电池用光吗?
- 易经藏玄机,科学奔赴的未来,竟是“神之境”
- 阿基米德:古希腊的力学之父,开启科学的黄金时代
- 从“两种文化”到“主体性黄昏”,刘慈欣王晋康谈科技与人文
- 1350元!我买了台5年前的华为系游戏本,今天仍是大学生神机?
- 国产崛起!苹果2025年度App奖项出炉:腾讯斩获年度最佳
- 他们,经得起“一镜到底”
- 闪存巨头壮士断腕!美光放弃消费者市场,国产机会来了?
- 2399元起!「性能旗舰新选择」一加 Ace 6T发布:同档找不到对手
- 13亿欧元的败笔:科学史上最昂贵的实验
- 华为日照金山路由器评测:路由器有颜了,对得起1299元的价格
- 口出狂言?初代网红罗永浩:我不会被限流,除非我「死」了
- CES官方剧透来了!AI成“绝对焦点”,AI硬件成全场主角
- 科学元典:科技创新的“思想压舱石”
- 华为Mate 80 实测称王:无惧户外强光,中国屏亮天下
- 火药味十足!荣耀高管犀利点评豆包手机:并不看好,撑不过三代
- 下周,科技板块最受投资者关注!
- 学习规划建议每日问答丨为什么要强化科学研究、技术开发原始创新导向
热门阅读
-
万事胜意不能乱说的原因?告诉你万事胜意该对谁说 12-09
-
科威特第纳尔为什么那么值钱?比美元值钱的货币盘点 12-22
-
撕心裂肺十大催泪情歌,10首哭到崩溃的歌曲 12-24
-
不敢公布马航真实原因,内幕曝光简直太惊人! 12-25
-
陈百强什么原因怎么走的,陈百强85事件是什么 01-05
-
麻将公式一定要背下来,麻将手气背转运小妙招 01-19
