因为几个美元字符,系统将一只标准贵宾犬识别为“小猪存钱罐”。
近日,非盈利式人工智能机构openai的研究人员发现,他们最先进的计算机视觉系统轻而易举的就被简单的一些工具忽悠了。简单的工具是什么?就是一支笔和一张纸。
实验发现,在研究人员拿笔在纸上写下单词“ipod”,并将该纸条贴在一个澳洲青苹果的表面上,随即clip系统没有“认出”青苹果,而是将它识别为“ipod”。作为对比,在没有粘贴纸条的实验中,系统识别结果准确性超过了85%。
在另一个实验中,研究人员只是在照片中的标准贵宾犬身上加上了几个美元符号,最终系统也识别失败,识别成“小猪存钱罐”。
这是为什么?
研究人员将这种攻击称作“文本攻击”,基于模型强大的读取文本的能力,即便是手写文字的照片,也能够做到“欺骗”模型。其中的核心在于clup的“多模态神经元”,后者能够对物体的照片,以及草图和文本做出反应。他们指出,这类攻击类似于蒙骗计算机视觉系统的“对抗性图像”,但是制作上却简单得多。
据悉,clip旨在探索人工智能系统如何通过在庞大的图像和文本对的数据库上进行训练,学会在没有密切监督的情况下识别物体。
本月初,针对clip的“多模态神经元”的表现,openai的研究人员已经发表了一篇新的论文进行阐述。他们发现“多模态神经元”——机器学习网络中的单个组件,不仅能对物体的图像作出反应,还能对素描、漫画和相关文本做出反应,类似单个脑细胞对抽象的概念而不是具体的例子做出反应。
只不过,相较于人类,该系统目前还处于初级阶段,也因此具备一定的危险性。针对这一点,研究人员也表明,他们已经可以骗过特斯拉自动驾驶汽车的软件系统,只需要在道路上放置一些贴纸,汽车便会在不发出警告的情况下改变车道。
邬贺铨:5G核心应用并非是下载一部电影的速度
华为/小米/苹果/Vivo/Oppo称霸91%中国手机市场,三星下跌
Linux内核分析 bind端口选择
5G影响下 MLCC电容行业将再次涨价
新品速看丨创新微MinewSemi正式推出GNSS高精度卫星定位导航模块
一张纸条居然就把最先进的机器视觉OpenAI骗了?
半导体并购热潮!英飞凌收购意法半导体或将受政府阻扰
国内在GPU领域能否打造自己的“英伟达”?
区块链域名将如何生成数字资产类别
网络安全事件频发,该怎么做才能阻止网络安全漏洞?
铁路高压线网中电弓的结构和工作过程
使非接触式编码器类型更加丰富的图尔克IO-Link不锈钢接口编码器
家电智能化的时代好处_家电智能化趋势
单键/1感应通道触摸芯片VKD233DS的特点介绍
全球半导体供应短缺的局面仍未得到改善
遨博智能、中为光电、海康智能发挥各自的优势,合作推出复合机器人
虹科前沿丨AR在医疗领域的应用如何?权威科学家告诉你!
骁龙X65调制解调器为玩家带来高速、低时延的网络连接
通信机房雷击浪涌的危害分析及防护方法
蓝牙定位在各行业领域中的应用及蓝牙定位原理浅析