浅谈一下大火的 ZAO 和人脸隐私安全
今天在各家的科技新闻那你都可以看到这款 App —— ZAO,其热度比上一次的灵鸽还要高不少,很多传统主流媒体也纷纷对这款 App 进行了报道,单从营销的角度上来说,ZAO 这一波是血赚的。
ZAO 是一款融合了「短视频」与「AI」这两个大热概念的产品,这款产品主打的功能是,你只需要上传一张你的照片,ZAO 就可以从你的这张照片中提取出人脸的相关信息,然后将你的脸替换到一些影视作品片段或是短视频中,形成一段所谓的「AI 换脸视频」。
由于这款 App 没有注册门槛,对于新用户其上手门槛很低,所以一时间它吸引来了非常多前来尝鲜的网友,这使其热度远超之前注册上需要邀请制且服务器卡得不行、App 概念理解困难的灵鸽。
虽然今天大量网友的涌入还是给予了 ZAO 服务器非常大的压力,在今日午间 ZAO 的服务器一度拥堵,但是和灵鸽相比,亲身体验到 ZAO 的网友比亲身体验到灵鸽的网友可以说是多出了一个量级,更别说灵鸽后续还从应用商店上下架了。
ZAO 这款 App 的产物是「换脸短视频」,这样的视频具有新奇、趣味性高、易于分享的特点。这样的短视频进入到社交网络后在很短的时间内就可以激起「裂变效应」,聚拢大量的人气。
互联网时代飞快的信息传播速度,能够吸引眼球的概念与内容,能够在社交网络激起裂变效应的产物,几乎没有的注册门槛以及极低的上手门槛,这些让 ZAO 在今天上线后的瞬间走红几乎成为了某种必然。
接下来助推 ZAO 及其相关话题不断发酵的就是 ZAO 本身的争议性内容了 —— 隐私问题。
自从 Facebook 的一系列隐私事件之后,不论是国内外网民们都变得比以前更加关心隐私问题。在互联网上,尤其是在国内的互联网上,个人隐私泄露的渠道实在是太多了,像外卖、网购、会员卡办理等无一例外都会涉及到个人隐私信息,酒店、民宿的预订以及金融相关的服务就更是如此了。除此之外一些问卷调查,一些 App 的注册等等也会涉及到个人隐私信息,当然,这些都还只是 C 端方面的。
在 B 端,在这个信息化、数字化的时代,众多的资料早已被录入进了各式各样的系统之中,其中有一部分就是需要对外、对公众提供服务的系统。这些系统并非是绝对安全的,它们可能会存在一些漏洞,黑客在利用漏洞入侵系统后可能就会触及到关键的数据,造成大量个人隐私信息的泄露。
这样的事情过去已经发生了太多起,哪怕我们在 C 端把隐私防护做到了非常好的水平,但是在 B 端发生的隐私泄露是我们无法主动防范的。也正是因为如此,有不少网友笑称数字化时代是「全民裸奔时代」。
ZAO 所涉及到的隐私问题在于对用户人脸数据的收集,就算 ZAO 没有在用户协议上作妖,「换脸」这个技术本身也是十分敏感的。
说到「换脸」,我们就不得不提到一个基于深度学习打造出来的惊世骇俗的应用 —— 「Deepfake」。
Deepfake 诞生于大约两年前,这项技术在诞生之后就一直朝着不可控的方向发展,早期美国总统的换脸恶搞视频、女星换脸色情视频,到现在 B 站上随处可见的各种换脸视频都是 Deepfake 技术的「杰作」。
Deepfake 是一个自编码器的特殊应用,它是一种单输入双输出的自编码器。
自编码器的作用是尝试将输入复制到输出上,在输出上复现输入的内容。普通的自编码器只有一个输入一个输出,除此之外还有一个隐含的中间变量 h。输入 x 会通过某种编码函数编码,得到中间变量 h,解码网络会从 h 中导入数据,将其内容重构得到输出与输入 x 近似的输出 r,这个中间变量 h 我们就可以看作是神经网络提取出来的特征。
在换脸上,自编码器可以从输入的人脸中提取出特征,然后这个特征在解码网络中会被重构成一个完整的内容,得到一个和输入类似的人脸。
为了达到换脸的效果,Deepfake 设计了两个输出。单一的输入端输入的是两个不同的人脸集,神经网络在将输入编码、提取特征、形成隐含变量 h 的过程中提取两个数据集之间的公共特征。
在输出这一侧,两个不同的解码网络会利用提取出的公共特征分别对应生成两种不同的人脸,得到生成的结果之后再通过算法将其合成到原有的人脸图像上(即所谓的「后期处理」),至此单张图片的换脸就完成了。
在实现对图片进行换脸后,我们也就自然可以实现对视频进行换脸,因为视频本身就是一个图片的集合,以每秒固定多少张(多少帧)的速率播放,我们只需要用这个技术对视频的每一张图片(每一帧)进行同样的换脸操作,最后将换脸后的图片集重新打包成一个视频,我们就得到了一个所谓的「AI 换脸视频」。
Deepfake 这项技术最终是开源了出来,这项技术的诞生极大地拉低了伪造视频的技术门槛,它的出现让假视频变得非常容易制作。在 Deepfake 的技术的基础上,也有人融入了其他技术对 Deepfake 进行升级,使其产出的假视频更加逼真等等。
ZAO 显然就是对 Deepfake 技术的某种升级与应用,在原始的 Deepfake 上,想要做出一段精致的换脸视频可不容易,它不但对算力有很高的要求,而且还对采集的数据集有很高的要求。
为了节约算力,ZAO 显然是预先对视频进行了处理,他们可能是预先做好了相关的模型,使得服务器只需要做一些边缘计算就能够得到一个「换脸视频」。为了保证比较好的处理效果,ZAO 应该也用了不少预处理算法来增强采集到的用户人脸照片以及输出的视频。
人脸这个信息之所以敏感主要是因为现在在国内社会人脸识别技术的应用实在是太广泛了,日常支付、车站乘车、银行业务等等基本上都用上了人脸识别。ZAO 这样的 App 意味着,只要不法分子的技术实力足够,他们只需要得到你的一张清晰人脸照片,就有可能可以伪造出一系列的视频来通过部分没有深度识别的人脸验证。除此之外,「换脸」这项技术亦可被用于炮制视频实施诈骗等。
这也正是为什么在 Deepfake 这个技术火起来之后,相应地也有一批团队在打造对抗模型、对抗算法来检测这一系列的「假视频」,他们试图通过深度学习去捕捉 Deepfake「换脸视频」的特征,从而实现打假的目的。
不论 ZAO 的用户条款是怎么写的,它多少都对用户的人脸数据做了采集并存在了服务器上。虽然 ZAO 已经更新了他们的条款并允许用户删除人脸数据,但相关数据是否被删除我们还不得而知,被采集到的数据除了用于生成这些娱乐化的视频外是否会被用作他用我们也不得而知。
哪怕 ZAO 并不会将这些人脸数据提供给第三方等,这一次的大火后,ZAO 也确实采集到了一个非常庞大的人脸数据集。如果 ZAO 的某个系统出现了什么漏洞导致信息泄露,这可能会给社会带来比较大的危害。
笔者个人的建议是就算你对这方面的应用、技术很好奇,也不要轻易去尝试它,如果你已经注册并且验证了人脸,现在通过 App 提供的删除将相关的数据删除掉会让你的隐私相对更安全一点。
如果你对 Deepfake 方面的技术感兴趣,你可以前往 GitHub 寻找如 DeepFaceLab、faceswap 之类的仓库,里面可能会有你喜欢的东西。