Deepfake 可以算是 2018 年最快速崛起的 AI 技术,通过学习人脸图像能够轻而易举的替换视频中的头像,从而伪造出几乎可以乱真的视频。虽然从 reddit 到 pornhub,全球黑白两道都已经开始对它进行了有意无意的封杀,但类似于 Fakeapp 这样的民间软件还是在网上开始传播起来。如果你还没有看过它的神奇效果,建议可以去油管搜一下 deepfake,已经有非常多的演示视频了。我也已经注意到,微博在最近几个月内,使用 deepfake 技术的视频在显著增多。

龚鸣:从核弹级 AI 技术 Deepfake 与区块链攻防战开始说起Deepfake 技术

尽管在目前很多场合下,这些都是实验性质的,毕竟看一下尼古拉斯凯奇演的夺宝奇兵或者小甜甜演的泰坦尼克号,这也许还能视为无伤大雅的玩笑。但很多人已经担心它被大规模用于非法用途,尽管目前还仅仅处于担心其用于色情视频的阶段,但我认为它在传播谣言、敲诈勒索甚至是恐怖主义等方面,也有着近乎于有着核弹级别的应用市场。

龚鸣:从核弹级 AI 技术 Deepfake 与区块链攻防战开始说起换成尼古拉斯凯奇的洛基

现在处于一个很特殊的时期,大多数民众完全不熟悉这种技术,而在技术圈已经可以很低成本的制造这种视频。而抖音这样可以广泛传播视频内容的软件,会加速这种现在还几乎无法用任何方法识别的视频大规模传播。谨慎的揣测,不排除在 2019 年 deepfake 由于某些事件,而出现井喷级的应用。并且有趣的是,我觉得有可能带动区块链技术在防伪领域的发展。

一方面是在防范虚假视频,如果一旦海量虚假视频的出现必然会导致之后,几乎所有的视频恐怕都需要在区块链上留下原始 hash 来证实真实性,以后也许只要没有留下链上指纹的人物视频都会被视为虚假,就如同和任何发来要求借钱的短信同样的待遇。另外一方面,制造和传播这些虚假视频需要不小的算力和带宽,尽管这种行为显然违法,但面对巨大的需求,不排除可能会有人试图通过去中心化的技术,分布式的方案来化解可能的法律风险。

对于如何防范虚假视频,最简单的方式就是由发布者对发布的视频进行签名,今后也许会只要没有签名的视频或者无法验证的签名视频,均视为虚假的视频。如果你不太了解签名技术的话,我简单解释一下,这有点像你去从网上下载各种软件,例如 Windows 的镜像文件,一般负责任的网站会给出该文件的 hash 值,你下载后的文件 hash 值如果和网站给出的一致,那么说明你下载的文件没有被篡改过。否则,哪怕该文件有一个字节的改动,hash 值都会无法对上。随着 deepfake 技术的普及,以后几乎任何视频恐怕都没办法在无 hash 值的情况下确认真实性,那么也许都需要校验 hash 值才可以确认其是否真实。到时候,估计会出现一些一键校验之类的工具。不过,需要注意的是,你在下载和使用这些工具前,也需要校验这些工具是否被篡改过。

龚鸣:从核弹级 AI 技术 Deepfake 与区块链攻防战开始说起

随着类似于 fakeapp 这样工具开始普及,民间也越来越容易开始自己制造虚假视频,并且肯定会有人尝试通过虚假视频造成恐慌或者来牟利。我们举个简单的例子,如果现在突然网上流传一个视频文件,内容是特朗普的讲话,他在视频中宣布比特币非法,任何持有和交易比特币的人都将被认定犯罪。考虑到特朗普个人性格的不确定性,很有可能造成一段时间的市场恐慌抛售,那么伪造视频的人可以借此大肆做空获利。

龚鸣:从核弹级 AI 技术 Deepfake 与区块链攻防战开始说起deepfake 伪造的特朗普视频

而随着大家对 deepfake 技术的了解,那么以后标准第一反应就是如果仅仅是视频片段,第一时间应该去找来源,如果没有来源默认就是假的。如果有来源,就去查看视频发布平台,比如政府网站,或者类似于 BBC,WSJ 这样的网站视频 hash,只要对不上就全部默认为假。当然,现在似乎媒体还没有给出视频 Hash 的习惯,也许在之后可能会成为标准。而这些记录如果放在区块链上就非常完美,区块链上的数据既是可以公开查询的,又是无法篡改的,那么大家校验起来会非常方便。

另一个比较可怕的应用而且无法事先给出 Hash 值的,那就是视频对话,如果一旦使用了 deepfake 技术,那么你基本上没办法确认和你对话的究竟是谁。大家可以想象一下,常见的诈骗短信可能骗不了你,那么你家人突然视频和你电话问你借钱,你会不会上当?更恐怖的就是,公司的电话会议,一个黑客甚至有能力通过软件同时模拟成 10 个人来欺诈对方。这时候,可能就需要对对方的身份、设备、地址,甚至是每帧进行校验。在那个时候,对方可能会需要使用一个证明自己身份的硬件 key 才能向对方确认自己的身份,这个 key 会类似于我们现在数字货币的硬件钱包,你只要用你密码打开后再用你的私钥签个名就可以。同样,区块链在此就可以作为一个完美的技术支持平台。

龚鸣:从核弹级 AI 技术 Deepfake 与区块链攻防战开始说起盖尔·加朵的伪造视频

我估计有人说,你的手机掉了,你的硬件钱包也掉了,你的密码也被人知道了,那这个方案不就没用了吗?那倒不是,既然你要再提高安全级别,还可以用多签名方案。如果你说多签名中的每一方都被坏人控制住了,坏人也获得了签名设备,并且知道了每个人的密码,那应该怎么办?那我个人的建议是,在这种情况下的确是没办法了,你还是先从了坏人,然后再报警吧。

我要再回答一下之前有网友提出来的疑问,就是区块链不能解决如果对方就是故意来骗你这件事情(「归根结底还是要追到人身上,问题总会变成怎么才能信任这个人,这个人要冒风险作假你是没办法查验的,也就是 AI 你根本防不了,区块链没法解决根本问题的」)。比如说,视频的确是特朗普本人发的,他就是来骗你的,或者你家人就是来骗你钱的。那当然不能解决,区块链并不负责解决真假问题,在这个方案里只解决传播途径真假问题。

我经常也看到在一些攻击区块链应用的文章里说,区块链解决溯源问题是个伪命题,因为没办法解决源头造假问题,如果写入区块链的数据就是假的,区块链怎么办?本来我觉得这种问题根本无需去回答,但没想到很多人还觉得的确有这样的问题,那我讲一下我的看法。区块链不解决人类说假话或者造假的问题,只负责固定一切证据并确保数据可查。着就像门锁厂不负责解决人类的偷盗问题,只负责解决无法在欺诈或者微暴力的情况下打开门。你不能说门锁不能解决偷盗问题,这个门锁的发明就是没意义的,车锁不能解决别人砸车窗盗车,车锁就是没意义的。一般的门锁,别说你拿出机枪或者坦克,就是来把太平斧估计也受不来了,更别说能不能让这个世界不存在偷盗问题,但大家从来没人说过门锁没用,既然如此,为什么我们要对区块链这么严苛?

有一篇名为《什么区块链,统统是骗子》中里面讲到:

我就想问了,区块链怎么保证最源头上的农产品就是有机的?还不是靠认证机构信用背书?那消费者直接接入认证中心验证不就好了吗?在这条链上,除了农户和认证中心,没有人有能力和技术知道自己经手的农产品到底这是不是真的有机产品,让他们加入到链上来有什么用?这区块链技术又一个脱裤子放屁的典型案例。所以说现在所有叫嚣着要用区块链改变行业的,都是非蠢即坏。实际情况就是,区块链什么都改变不了。

所谓区块链解决溯源问题,就是确保整个流程中数据明确可查,如果有造假那就是可以查询并证明源头造假。比如 LV 的制造商接到指令要做 1000 个 ID 不同的限量包,但是偷偷做了 1001 个,其中有两个编号一摸一样,这个当然可以,它也可以写入到区块链上,但只要写入,在链上有读取权限的人马上就发可以发现这个问题,并且可以百分百确定这事情就是写入方干的,而该制造商是没办法说自己不知道或者是其它人干的。

再举一个例子,比如某牛奶制造商将过期的牛奶生产日期修正后写入到区块链中,的确是可以做到,但只要有原日期在链上,检查方可以实时发现多次写入问题。如果它第一次写入就是错误的,也可以,只要一旦发现牛奶过期产生问题就可以几乎瞬间找到是他干的,而不是中间物流商或者超市干的。这就是比较典型区块链的溯源应用,如果你说只要这个技术不能阻止他写入虚假数据,这个技术就没用,我个人是不同意这样的观点的。

事实上,溯源造假问题始终是一个很大的问题,因为大多数产品,从生产到物流,到销售终端,甚至是二次流转的环节是非常非常繁多,参与方动辄成百上千家,区块链技术如果能把造假仅仅局限在数据最初写入端并且提供不可篡改的证据,这本身就已经解决了行业内的不少问题。最重要的是,通过公链信用,即使是小厂家都可以参与其中,并且如果利用现有公链来操作,整体需要投入技术成本也不会很高。而作者所说的,为什么不能靠成立一个全国性的认证机构信用背书来完成,这个……,我当然不敢说不行。我只能说,年轻人,如果在朝鲜这么操作的话,出了会增加更多的行政成本、寻租空间,其它那真的是什么都没改变。

再稍微扩展说一下,对于某些质疑者可能还会说,我承认你说的可能是有那么一点道理,但是你们整天把区块链技术吹的天花乱坠,最后也就是记录这些数据而已,而且现在没有区块链技术我们也挺好的,区块链最多也就是起点锦上添花的作用,至于要说到什么革命性,我真的看不出来。这说的没错,因为事实上,区块链的革命性的确不体现在这里,根据之前的阐述,区块链溯源应用仅仅是利用了区块链上数据不可篡改的特性,至于说到革命性,我的观点还是在于去中心化(当然考虑到国内的政治正确,我们也可以称它为多中心化或者分布式)。

我的个人看法是,所谓去中心化的潜在含义其实可以看成「去人化」,即去掉人为参与这个环节,把所有的东西交给程序。从很多角度来看,「人」这个因素,一般是整个环节中最不可靠的环节,不仅脆弱不稳定还容易造假。所以,区块链只是不能解决人类造假的问题,如果要彻底解决上链数据造假问题,那很简单,即通过区块链和物联网的结合将所有的环节交给机器和程序。

IBM 在 2013 年的物联网白皮书《设备民主》中就已经描述过类似的场景,通过去掉人参与的因素,可以解决很多的问题。目前看上去区块链最强应用领域是金融,金融中最强的是支付,但这往往是指的现有人类的金融世界。我的观点是,还有一个更大的拓展空间就是 m2m (machine to machine)的支付和金融,这才是区块链最能发挥的领域,有机会可以另外撰文阐述。

龚鸣:从核弹级 AI 技术 Deepfake 与区块链攻防战开始说起