把松鼠当海狮蜻蜓当井盖为什么图像识别AI会犯这些低级错误

目前的人工智能技术已经非常擅长识别图像中的物体,但仍然很容易犯些“低级错误”。
在部分情况下,只需在人眼不可见的静态噪声中添加一些可选的笔触或图层,就可以“愚弄”AI图像识别系统,这有时甚至会造成致命的后果。
例如,曾有研究人员将打印的涂鸦贴在路牌上导致AI自动驾驶系统将限速标志识别为禁行,腾讯科恩实验室也曾发布报告称路面上难以注意到的小贴纸就能误导特斯拉错误判断并驶入反向车道。
这些误导标志被称为“对抗补丁”,研究人员现在正忙于开发保护人工智能系统不受这些例子影响的方法。
但在去年的一篇论文中,Google Brain和普林斯顿大学的一组研究人员,包括该领域最早的研究人员之一Ian Goodfellow,认为这些新研究过于理论化,没有抓住重点。
他们说,虽然大部分研究的重点是保护系统免受特别设计的标志的干扰,但黑客可能会选择一种更直接的方法:使用一张完全不同的照片,而不是在现有照片上叠加噪音图案。这也可能导致系统误判断。这一批评促使加州大学伯克利分校的博士生Dan Hendrycks编写了一个新的图像数据集。
这个数据集中包括一些容易被误判的图像,比如松鼠(它们通常会被误认为是海狮)或蜻蜓(它们会被误认为是井盖)。他表示:“这些例子似乎更难防范。”
人工合成的对抗标志需要知道所有的人工智能系统是如何防范误判的。但相比之下,即使人工智能系统各自的防范措施不同,这些自然的例子也能很好地发挥作用。
Hendrycks上周在国际机器学习会议上发布了该数据集的早期版本,包含大约6000幅图像。他计划在几周内发布最终版本,其中包括近8000个图像。他打算让研究团体使用该数据集作为基准。
换句话说,与其直接在图像上训练图像识别系统,不如将其保留下来只用于测试。他说:“如果人们只是用这些数据集训练系统,那么系统仅仅只是记住了这些例子。这样虽然系统已经解决了误判这些图像的问题,但它们对新图像的误判程度并没有得到改善。”
破解这些令人困惑的误判背后的逻辑,可能会让系统的适应性更广。“为什么系统会把蜻蜓和鳄梨色拉酱搞混?”Hendrycks开玩笑道,“根本不清楚为什么会犯这样的错误。”
为什么人工智能会误判?
有些人工智能系统的底层计算机制是已知的,有些则不是,这被称为“黑箱”,即该系统的开发者可能都无法完全了解系统如何做出决策。
对于图像识别技术来说,有时原因是因为给定的训练数据集出了问题。比如近日Facebook人工智能实验室的一项新研究就表明,科技巨头销售的物体识别算法在识别来自低收入国家的物品时表现得更差。
据报道,研究人员测试了五种流行的现成对象识别算法——微软Azure、Clarifai、谷歌Cloud Vision、亚马逊Rekognition和IBM Watson。而测试的图像包括来自全球不同阶级的家庭的家中用品的图像。这些图像可能来自非洲布隆迪的一个月收入27美元的家庭,也可能来自乌克兰一个月收入1090美元的家庭。
研究人员发现,与月收入超过3500美元的家庭相比,当被要求识别月收入50美元的家庭的物品时,物体识别算法的出错率要高出10%左右。
而且在识别来自美国的照片时,算法的准确性也比识别来自索马里或布基纳法索的照片要高出15%至20%。
研究人员称,在一系列用于图像识别的商业云服务中,这些发现具有一致性。
人工智能算法的这种“偏见”还有很多别的例子,其中一种常见的推测原因是用于培训的数据有了偏颇——它们往往反映了相关工程师的生活和背景。由于这些人通常是来自高收入国家的白人男性,他们训练的算法所要识别的世界也是如此。
研究人员称,视觉算法的训练数据主要来自欧洲和北美,“在人口众多的地理区域,特别是非洲、印度、中国和东南亚,对视觉场景的采样严重不足”。
由于美国科技公司在人工智能领域处于世界领先地位,这可能会影响到从照片存储服务、图像搜索功能到更重要的AI安全摄像头、自动驾驶汽车等系统的方方面面。
“评估人工智能系统并不一定容易,因为没有执行这类评估的标准基准。”帮助开展这项研究的Facebook人工智能研究科学家劳伦斯·范德马顿(Laurens van der Maaten)在接受采访时表示。
“对抗这种偏见最重要的一步是,在培训AI系统之前的数据收集环节就要谨慎得多。”
值得注意的是,科技公司们经常把自家人工智能产品宣传为“人人平等、人人可得”,但实际上,它们可能只是在按照自己的形象来评估、定义和塑造世界。
大家都在看
-
破三十年未解之谜!发现基因组“守护因子”,九院七年深耕连出重磅成果 近日,上海交通大学医学院附属第九人民医院在基础研究与临床转化融合领域取得重大突破。由九院肿瘤科、上海精准医学研究院联合组建的雷鸣/张燕捷团队,先后在国际权威期刊《自然通讯》(Nature Communications)与《 ... 未解之谜06-24
-
浙江抽水惊现龙宫?33年前那场“探宝”,留下五大未解之谜 在浙江西部,有个叫龙游的小县城,平日里安安静静,没啥存在感。但在1992年,这地方一下子火了,原因就出在石岩背村那几个水潭上。村里有几个水潭,看着面积不大,也就二十来平米,可邪门得很。谁也不知道它们有多深 ... 未解之谜06-24
-
中国四大未解之谜,至今无人能破解 我前两天在图书馆翻旧书,偶然看到一本1982年影印的《清宫医案研究》,里头同治那页缺了两行,纸角发脆,被人用铅笔轻轻圈了个“?”旁边还有一行小字:“此页原缺,据光绪朝抄本补,存疑。”我盯着看了好几分钟,不 ... 未解之谜06-16
-
从全民热议到无人问津,风靡全球的三大未解之谜,全是百年骗局? 文/编辑:老张鉴语在十几年前的互联网和书刊杂志中,百慕大三角、尼斯湖水怪、复活节岛石像等未解之谜,是无数人津津乐道的神秘话题。这些自带奇幻色彩的传说言之凿凿,搭配离奇的目击事件与无解的现场细节,一度被大 ... 未解之谜06-13
-
中国四大未解之谜!千百年争论不休,至今无标准答案 漫漫历史长河中,留存着诸多扑朔迷离的谜团。有不少历史事件很知名,但记载模糊、说法各异,后世学者反复考证、民间众说纷纭,却始终无法拨开层层迷雾。今天列举其中四大经典未解之谜,每一件都疑点丛生,千百年来无 ... 未解之谜06-11
-
世界五大未解之谜,每个都令人赞叹不已 1、纳特龙湖之谜在坦桑尼亚的北部有片湖,湖水颜色通红,碱性特别强,温度动不动就飙升到极高。有不少鸟儿掉进湖里死后慢慢变成像石头一样的干尸,当地一直在传只要沾到湖里的水,动物立马会变成石像。相关的地理和 ... 未解之谜06-09
-
我国十大考古未解之谜,件件匪夷所思,谜团背后藏着惊天真相 华夏上下五千年,史册记下的故事不过冰山一角,太多古人秘事、奇绝手艺、失落国宝,被岁月深埋泥土,变成一桩桩百思不解的考古谜团。一代代考古学者踏遍大江南北,靠着现代仪器、史料典籍反复推敲,不少谜题依旧众说 ... 未解之谜06-08
-
这五大中国“未解之谜”,已被专家解开了 原创:认真生活的女孩原发:生活精选学(微信公众号)1、内蒙古巨石“自转”之谜在内蒙古的大草原上,矗立着一块重达数吨的巨石。这块石块的特别之处就是它的位置不仅会悄悄偏移,看起来还像是在原地转动的。时间长 ... 未解之谜06-08
-
历史长河中的未解之谜:那些至今让人困惑的秘密 一、亚特兰蒂斯:失落的文明之亚特兰蒂斯是古希腊哲学家柏拉图在其著作中提到的一个高度发达的古代文明。据说,亚特兰蒂斯拥有先进的科技和繁荣的社会,但因灾难性的地震和海啸而沉没于海底。尽管现代科学家和探险家 ... 未解之谜05-29
-
中国历史五大未解之谜,至今无合理解释,你知道几个? 中华上下五千年,留下了无数璀璨的文明瑰宝,也留下了诸多令人费解的谜团。它们跨越千年,历经岁月冲刷,依旧没有权威、合理的解释,吸引着无数史学家、考古学家前赴后继地探索。以下这五大未解之谜,堪称中国历史上 ... 未解之谜05-25
相关文章
- 历史四大未解之谜,至今无人破解
- 爱泼斯坦“遗书”曝光:一句“什么也没发现”背后,藏着多少未解之谜
- 明朝六个未解之谜,至今仍未能知道真相,最后一个贯穿整个明朝。
- 历史上3大未解之谜,每一个都超乎想象
- 《蜜语纪》大结局过后,留下了4处未解之谜
- 中国历史上的四大未解之谜
- 中国十大未解之谜!百年古尸贴有黄符,六祖慧能千年肉身不腐
- 中国历史上3大未解之谜:一个比一个诡异,最后一个至今无人能解
- 华夏千古未解之谜一个凭空消失一个下落成迷 真相至今无人敢下定论
- 这5个未解之谜,已经被解开了
- 历史长河中的十大未解之谜:穿越千年的迷雾与回响
- 四足动物肢体姿势转变与体型演化如何关联?最新研究揭开未解之谜
- 夜读丨体育老师的“未解之谜”
- 中国历史上3大未解之谜,第2个中国一大遗憾,第3个没人说得清楚
- 相声界三大未解之谜,困扰江湖几十年,至今没人能说清
- 宇宙6大未解之谜,科学家认为:可能人类永远找不到答案
- 中国七大未解之谜:件件颠覆认知,千年无人破解,真相细思极恐
- 人类的十大未解之谜:你的寒假作业,写了吗?
- 宇宙7大未解之谜,科学家承认:可能人类永远都找不到答案
- 中国至今未解之谜,迷一样的历史,迷一样的历史
热门阅读
-
119碎尸案,场面让人震惊,胆小者勿入 07-11
-
96年南大碎尸案,刁爱青被杀后整齐切了两千多刀 07-11
-
南大碎尸案史上最惨案件,揭开陈年悬案的真相! 07-11
-
历史上10件真实神秘失踪事件,揭秘人类失踪之谜 01-30
-
韩国三大悬案,韩国三大悬案之首告破 05-06
-
长生不老药已研制成功,人类可以长生不老 08-13
