新病毒来了：用一个“魔术色块”，能完全骗过机器识别

2018-01-05 07:45

钛媒体合作伙伴

以往，我们不能改变真实世界中的像素点，但如果把这些小图案变成贴纸粘在各个地方，就可以改变很多东西。如果在限速、停止牌上都上贴纸，自动驾驶系统会不会将其视若无物，让整个世界乱套？

在AI技术构建出的未来世界蓝图中，有大量装置是通过机器视觉这一最基础的技术实现的。GPU的广泛应用给了机器快速处理图片的能力，神经网络让机器可以理解图片。

正因如此，我们才能够通过摄像头分辨眼前这张脸是不是iPhone X的主人、从监控录像中找到犯罪分子的身影，以及自动分辨社交网站上的某张照片是否涉嫌有色情内容。

不过机器视觉和人类视觉有着很大的差异，比如说在出现误差方面，机器和人类就有很多不同。比如人类视觉往往会因为线条的排列分布而分不清究竟是直线还是曲线。

抓住机器识别的缺点，能让AI变糊涂的“新病毒”

（著名的黑林错觉）

但机器视觉的错觉，往往要比人类的有趣得多。

如何欺骗愚蠢的机器视觉？

大家一定听说过一个“欺骗”深度学习神经网络的例子，只需改变几个像素，就能得到差异巨大的结果。

抓住机器识别的缺点，能让AI变糊涂的“新病毒”

就像这张照片，前一秒神经网络还有57.7%的把握认为它是一只熊猫，可在经历过一点点处理后，神经网络竟然99.3%的把握认为这是一只长臂猿。可对人类来说，这两张照片几乎没有区别。

出现这种情况的原因是，人类和机器有关“视觉”的概念是很不一样的。人类的视觉来自于对事物的整体理解，建立于长久以来对世界的认识之上。我们看到毛茸茸的东西就会认为是动物，看到羽毛就会认为是鸟。这样的模式让我们的视觉是感性甚至模糊的，不光可以分辨我们认识的物品，甚至可以去分辨我们从没见过的物品。

但机器的视觉模式就很不同了，机器学习算法本质上是一个分类器，通过层层神经网络去分辨一张图片是不是猴子、是不是水杯、是不是电脑、是不是……最后输出结果，告诉人们这张照片有90%的可能是水杯，还有40%的可能是一颗树。

这时要想让机器产生错觉就很容易了。假如我们想要让机器把水杯“看成”树，就要找到机器眼中两种物品的临界点。一张图片在机器眼中，只是无数像素点的排列，如果轻微的改变这些像素的排列，让他们越过这个临界点，机器就会犯错。

结果就是，要不机器会把两张人眼中完全一样的图片看成两种完全不同的东西，要不会把一张不知所云的图片看成物品或动物。

对抗样本：让机器变糊涂的新病毒

这种能欺骗机器的图片还有个名字，叫对抗样本。我们可以把对抗样本理解为一种攻击机器视觉的“病毒”，面对不同的机器学习算法会有不同的样本生成方式，最终目的只有一个，那就是混淆机器的视觉。

可怕的是，目前还没有什么好的方式去解决这种病毒。只能不断的自己生成样本进行对抗，或者不断压缩模型类别标签的大小，让攻击者难以找到其中的临界点。

不过我们也不必对这种病毒太过恐惧，目前大部分对抗样本为了加强机器视觉的精确度而特地生成的。很难自然发生在现实应用场景中，毕竟你不能改变自己脸上的像素点分布。

尤其当对方不能直接访问算法模型时，制造出对抗样本的成本也会很高。举个例子说，如果有博主想依靠在社交媒体上发布色情内容来盈利，就要首先训练出一个能对所有图片进行微调，并且还能欺骗过社交媒体审核算法的对抗模型。再对每天需要发布的图片进行处理。有这个时间、金钱成本和技术，早就可以去AI初创企业拿百万年薪了。

所以，我们大可不必担心对抗样本会对现实产生什么影响。直到一群来自Google的专家又想出了产生对抗样本的新方法。