把松鼠当海狮蜻蜓当井盖为什么图像识别AI会犯这些低级错误

目前的人工智能技术已经非常擅长识别图像中的物体,但仍然很容易犯些“低级错误”。
在部分情况下,只需在人眼不可见的静态噪声中添加一些可选的笔触或图层,就可以“愚弄”AI图像识别系统,这有时甚至会造成致命的后果。
例如,曾有研究人员将打印的涂鸦贴在路牌上导致AI自动驾驶系统将限速标志识别为禁行,腾讯科恩实验室也曾发布报告称路面上难以注意到的小贴纸就能误导特斯拉错误判断并驶入反向车道。
这些误导标志被称为“对抗补丁”,研究人员现在正忙于开发保护人工智能系统不受这些例子影响的方法。
但在去年的一篇论文中,Google Brain和普林斯顿大学的一组研究人员,包括该领域最早的研究人员之一Ian Goodfellow,认为这些新研究过于理论化,没有抓住重点。
他们说,虽然大部分研究的重点是保护系统免受特别设计的标志的干扰,但黑客可能会选择一种更直接的方法:使用一张完全不同的照片,而不是在现有照片上叠加噪音图案。这也可能导致系统误判断。这一批评促使加州大学伯克利分校的博士生Dan Hendrycks编写了一个新的图像数据集。
这个数据集中包括一些容易被误判的图像,比如松鼠(它们通常会被误认为是海狮)或蜻蜓(它们会被误认为是井盖)。他表示:“这些例子似乎更难防范。”
人工合成的对抗标志需要知道所有的人工智能系统是如何防范误判的。但相比之下,即使人工智能系统各自的防范措施不同,这些自然的例子也能很好地发挥作用。
Hendrycks上周在国际机器学习会议上发布了该数据集的早期版本,包含大约6000幅图像。他计划在几周内发布最终版本,其中包括近8000个图像。他打算让研究团体使用该数据集作为基准。
换句话说,与其直接在图像上训练图像识别系统,不如将其保留下来只用于测试。他说:“如果人们只是用这些数据集训练系统,那么系统仅仅只是记住了这些例子。这样虽然系统已经解决了误判这些图像的问题,但它们对新图像的误判程度并没有得到改善。”
破解这些令人困惑的误判背后的逻辑,可能会让系统的适应性更广。“为什么系统会把蜻蜓和鳄梨色拉酱搞混?”Hendrycks开玩笑道,“根本不清楚为什么会犯这样的错误。”
为什么人工智能会误判?
有些人工智能系统的底层计算机制是已知的,有些则不是,这被称为“黑箱”,即该系统的开发者可能都无法完全了解系统如何做出决策。
对于图像识别技术来说,有时原因是因为给定的训练数据集出了问题。比如近日Facebook人工智能实验室的一项新研究就表明,科技巨头销售的物体识别算法在识别来自低收入国家的物品时表现得更差。
据报道,研究人员测试了五种流行的现成对象识别算法——微软Azure、Clarifai、谷歌Cloud Vision、亚马逊Rekognition和IBM Watson。而测试的图像包括来自全球不同阶级的家庭的家中用品的图像。这些图像可能来自非洲布隆迪的一个月收入27美元的家庭,也可能来自乌克兰一个月收入1090美元的家庭。
研究人员发现,与月收入超过3500美元的家庭相比,当被要求识别月收入50美元的家庭的物品时,物体识别算法的出错率要高出10%左右。
而且在识别来自美国的照片时,算法的准确性也比识别来自索马里或布基纳法索的照片要高出15%至20%。
研究人员称,在一系列用于图像识别的商业云服务中,这些发现具有一致性。
人工智能算法的这种“偏见”还有很多别的例子,其中一种常见的推测原因是用于培训的数据有了偏颇——它们往往反映了相关工程师的生活和背景。由于这些人通常是来自高收入国家的白人男性,他们训练的算法所要识别的世界也是如此。
研究人员称,视觉算法的训练数据主要来自欧洲和北美,“在人口众多的地理区域,特别是非洲、印度、中国和东南亚,对视觉场景的采样严重不足”。
由于美国科技公司在人工智能领域处于世界领先地位,这可能会影响到从照片存储服务、图像搜索功能到更重要的AI安全摄像头、自动驾驶汽车等系统的方方面面。
“评估人工智能系统并不一定容易,因为没有执行这类评估的标准基准。”帮助开展这项研究的Facebook人工智能研究科学家劳伦斯·范德马顿(Laurens van der Maaten)在接受采访时表示。
“对抗这种偏见最重要的一步是,在培训AI系统之前的数据收集环节就要谨慎得多。”
值得注意的是,科技公司们经常把自家人工智能产品宣传为“人人平等、人人可得”,但实际上,它们可能只是在按照自己的形象来评估、定义和塑造世界。
大家都在看
-
夜读丨体育老师的“未解之谜” “爸爸,你想不想听听‘世界未解之谜’?”新学期开学没两天,一起绕着小区欢乐跑的时候,大宝略显神秘地对我说。对这种要求,我当然是求之不得。我总觉得,一个十一二岁的小孩,还愿意跟你说说话、开开玩笑,无论如 ... 未解之谜03-23
-
中国历史上3大未解之谜,第2个中国一大遗憾,第3个没人说得清楚 这3个是公认最有分量、最戳中国人心结的历史悬案,正好对应你说的:一个神秘无解、一个千古遗憾、一个彻底说不清楚。 一、三星堆文明起源之谜——最诡异的“天外来客”文明 三星堆一出土就震惊世界,却直到今天全是 ... 未解之谜03-23
-
相声界三大未解之谜,困扰江湖几十年,至今没人能说清 要说娱乐圈最有“江湖气”的圈子,相声界绝对排第一!台上说学逗唱逗人乐,台下师承辈分、恩怨情仇藏得深,尤其是那三大未解之谜,传了几十年,比相声段子还抓心,业内没人能拍板,网友吵得快把评论区掀翻,今天就来 ... 未解之谜03-23
-
中国七大未解之谜:件件颠覆认知,千年无人破解,真相细思极恐 中国七大未解之谜:件件颠覆认知,千年无人破解,真相细思极恐华夏五千年文明,藏着无数惊世谜团,有的凭空出现、有的离奇消失,科学无法解释,史料语焉不详,每一个都戳中人性的好奇与敬畏,越深挖越脊背发凉。三星 ... 未解之谜03-13
-
人类的十大未解之谜:你的寒假作业,写了吗? “寒假作业写完了吗?”这灵魂一问,足以让无数中华学子在开学前一周陷入集体性心律不齐。据不科学统计,它是继“早饭吃什么”、“晚饭吃什么”之后,中国家庭的第三大高频灵魂拷问。寒假作业,一种神奇的存在。放假 ... 未解之谜03-04
-
中国至今未解之谜,迷一样的历史,迷一样的历史 中国至今未解之谜,谜一样的历史,谜一样的历史。那些藏在史书缝隙里的悬案,不是史料残缺,而是人性与权力故意留下的留白。传国玉玺失踪、九鼎沉江、建文帝人间蒸发、武则天立无字碑,每一个谜团背后,都是帝王心术 ... 未解之谜02-27
-
极目星河深处 求索未解之谜(科技自立自强) 核心阅读快速射电暴是宇宙中最神秘的射电爆发现象之一,其持续时间仅为数毫秒,却能在瞬间释放相当于太阳一整周辐射总和的巨大能量。如何解开这类“宇宙射电脉冲闪”的起源机制谜团?1月16日,由中国科学院紫金山天 ... 未解之谜01-19
-
极目星河深处 求索未解之谜(科技自立自强) 图为“中国天眼”馈源舱。 新华社记者 欧东衢摄核心阅读快速射电暴是宇宙中最神秘的射电爆发现象之一,其持续时间仅为数毫秒,却能在瞬间释放相当于太阳一整周辐射总和的巨大能量。如何解开这类“宇宙射电脉冲闪”的 ... 未解之谜01-19
相关文章
- 极目星河深处 求索未解之谜(科技自立自强)
- 极目星河深处 求索未解之谜(科技自立自强)
- 中国历史上5大未解之谜,困扰专家千年,至今无人能破
- 罗布泊未解之谜揭晓?50人科考队四年探秘,真相震惊学界
- 21个未解之谜,哪一个让你心绪难平?
- 历史上的“未解之谜”大揭秘,真相令人震惊!
- 宇宙5大未解之谜,科学家承认:可能人类永远都找不到答案
- 高维空间可能真的存在,科学家:它可以完美解释两大宇宙未解之谜
- 21个令人不寒而栗的未解之谜,至今仍然悬而未决
- 13个毛骨悚然的未解之谜:跨越世纪的悬案,至今让世人深夜难眠
- 宇宙最终将陷入一片黑暗?诺奖得主深度解读天文学未解之谜
- 中国古代最神秘的十大未解之谜,至今无人破解!
- 未解之谜!云南这座“神山”,只要日本人在,它就会消失不见
- 云南5大未解之谜,至今还是未解之谜,来看看有哪些谜团?
- 陕西秦岭腹地神仙秘境,藏着中国唯一的自然奇观,至今是未解之谜
- 宇宙5大未解之谜,科学家认为:可能人类永远找不到答案
- 探秘全球十大未解之谜,这些古建筑至今让科学家束手无策
- 山海经里还藏着哪些秘密? 探索古代奇书背后的未解之谜
- 缪延亮:国际货币体系的未解之谜
- 地球上未被证实不明神秘生物有哪些(尼斯湖水怪、天池水怪、天蛾人
热门阅读
-
119碎尸案,场面让人震惊,胆小者勿入 07-11
-
96年南大碎尸案,刁爱青被杀后整齐切了两千多刀 07-11
-
南大碎尸案史上最惨案件,揭开陈年悬案的真相! 07-11
-
历史上10件真实神秘失踪事件,揭秘人类失踪之谜 01-30
-
韩国三大悬案,韩国三大悬案之首告破 05-06
-
长生不老药已研制成功,人类可以长生不老 08-13
