科学读心术来袭,你想什么我都知道
在科幻小说《三体》中,作家刘慈欣构想了一种外星智慧“三体人”,他们彼此通过脑电波交流,思维完全透明,没有欺瞒和撒谎的可能性。
不只《三体》,很多科幻小说中都有类似对于“透明思维”的设想。它往往被与更高级的智慧体挂钩,被看做是一种摆脱了人性弱点,展现出极度理性冷静的思维方式。
但伴随这种思维而来的缺点,就是我们不再享有任何思想上的“隐秘地带”,隐私全部公之于众,没有一点私人空间。
这种“读心术”般的思维方式细思极恐,但随着科技的发展,我们的“思维围墙”确实在受到挑战,而一位华裔科学家的最新研究,更是让直接读取意识变成现实。
霍金, 科技“读心术”的见证者
这种“读心术”式的研究其实并不新鲜,现在,包括 Facebook 神秘部门 Building 8 在内的不少公司,都在进行类似的研究。
本质上来说,这是脑机接口技术的一种实际应用。
本质上来说,这是脑机接口技术的一种实际应用,简单来说,就是通过在大脑上植入电极片,直接读取大脑中的信息,以此来帮助语言障碍者进行正常的交流。
用外部设备辅助生成语音的技术早已有之,其中我们最熟悉的,莫过于霍金使用过的一些辅助交流设备。
霍金从 21 岁起就开始受到“渐冻症”的折磨,43 岁时,他因为肺炎被迫接受了气管切开手术,并因此丧失了语言能力。
最初,霍金使用的是没有技术含量的拼写板,完全依靠眼神选定区域、颜色,然后再挑眉表示确认,拼写一个单词要花费几分钟的时间。
后来,美国 Words+ 公司开发了一套名为 Equalizer 的软件,他们在霍金的轮椅上安装了一台显示器,当光标扫过想要的字母时只需按键确认。用这种方法,霍金每分钟能拼出 15-20 个单词。
但这些只能满足传达基本的思想的要求,却无法帮助语言障碍者真正“发声”。
为了解决这个问题,霍金的家人联系到一家语音合成器公司,但这台设备能实现的效果,也仅仅类似于一个朗读软件,输入文字的环节仍然无法省去。
虽然效率没有明显提升,但靠着这台语音合成器的加持,霍金得以更便捷地传达信息,在这个阶段出版了经典作品《时间简史》。
随着疾病的蔓延,到了 2008 年,霍金全身上下仅剩下部分面部肌肉可以活动,他的装备又面临着新一轮升级。
他的助理开发出了一个叫做 cheek switch 的装置,也就是此后我们经常在霍金面部看到的那个支架。
从本质上来说,它的原理与 Equalizer 相同,只是用面部肌肉的活动代替了手指操作。当收缩面部肌肉时,红外传感器接受到的距离信号发生变化,此时便会向电脑发出确认的反馈信号。
但在接下来的几年间,随着面部肌肉的退化,霍金的“说话”速度不断下降,最初每分钟 5-6 个词,到了后期,往往半小时才能拼完一个完整的句子。
科学家们也曾经尝试用最新技术提高输入效率,比如英特尔工程师就曾考虑过眼球追踪技术,但由于霍金的眼睑已经产生了严重的下垂,阻挡了对于眼部细微动作的追踪,此方案最终也被放弃。
霍金所使用的交流工具,基本可以看作是人类在辅助交流技术上进化的缩影。但直到去世,霍金所使用的辅助交流技术仍是以拼写为基础,不仅效率低下,还严重受制于集体的运动能力。
科学家们也不是没有考虑过脑电波识别技术,只是受限于当时的技术,这个方案的精确度远达不到正常沟通的要求。
150词/分钟, 失语症患者的新希望
脑机接口的研究可以分成两个大的方向。
一类专注输入,例如马斯克创办的 Neuralink,其目标是为我们的大脑带上一顶「巫师帽」,通过植入芯片或者外设头盔等,来强化人脑的记忆力、思维能力等。
还有一类,是研究如何直接将脑皮层发出的电信号转换为语言,让用户无需开口或活动,只要静静地坐着,就能通过外设发声说话。
第一种可以帮助人类变身“赛博格”,而论起当前的应用价值,无疑还是专注“输出”类的技术更有价值。
根据美国失语症协会的统计,2016 年在美国就有 200 多万人因为各种原因,而受到失语症的困扰,如果帮助他们重获沟通能力,很长时间以来,医生、认知学家、语言学家都在各自领域做着相关努力,但却收效甚微。
在这个方面,脑机接口是目前最具潜力的技术。
事实上,将脑电波转换成语音并不是什么新鲜事,去年麻省理工的团队就展示过一款意识读取设备 AlterEgo,它通过 16 个电极来捕捉面部神经肌肉信号,并配合神经网络,达到“破解”用户意识的目的。
但这款产品暂时只能识别几十个词汇,对于稍复杂的语言就显得捉襟见肘了。
而如今,这个困扰人类十几年的难题终于迎来了突破性进展。
上周,顶尖学术期刊 Nature 上刊登了一片论文,来自加州大学旧金山分校的团队开发了一套新系统,能将人讲话时产生的神经信号解码,并合成为语音。
项目的主要参与者之一,华裔教授 Edward Chang
最具价值的是,它突破了词汇量的限制,同时,系统的合成语速可以达到每分钟 150 词,与人类的正常语速相当。
说话是人类的本能,我们只要思考好自己的想要表达的内容,之后如何调动声带、协调口齿、运动肌肉都是自然而言的过程,但对于要模仿人类语音的工程师而言,这却是一项巨大的工程。
解码意识的第一步,就是要确定大脑皮层信号与说话时器官运动特征的关联。
为此,团队研究人员招募了 5 位有语言障碍的癫痫患者志愿者,并在他们脑内植入了电极阵列。
志愿者被要求读出几百个句子,在此过程中,电极将记录皮层运动层中神经元的放电模式,而研究人员则会将这些与器官运动的特征进行匹配。
随后,两个 AI 神经网络开始参与言语分析,一个负责解读器官的运动,另一个则对志愿者发出的含混不清的音节进行解析。
之后将两个模型产出的数据进行重叠,结果表明,机器解读的准确率达到了 70%。
不过,你可能也注意到了,参与测试的志愿者只是患有严重的严重的语言障碍,而非完全的失语。如果这项技术被用到“霍金们”的身上,会产生什么样的效果呢?
结果发现,当志愿者完全丧失发声能力的情况下,这套系统还能用,不过解码出的结果,准确率就要低得多了。
不过,对于这项研究的未来,加州大学的研究团队还是持很乐观的态度,他们认为,脑机接口未来将在言语康复领域中发挥至关重要的作用。
与此同时,技术论坛 Hacer Noon 上的网友却不淡定了,毕竟如果有一天这项技术得以广泛运用,那就意味着我们要从此与“脸上笑嘻嘻,心里 mmp”的社交法则告别了。
“我有一句 mmp 不知当讲不当讲…”(好了,你已经讲出来了)
当然,这只是调侃,因为这项技术使用的电极阵列,必须通过开率手术放置到大脑,而且,它需要有器官运动数据作为前提,这就意味着,如果你不想开口,芯片也奈何不了你。
无论对于大脑或是脑机接口,人类的理解还远远不够,因此许多人对脑机接口持有一种抵触的情绪。但殊不知,人类早在 40 年前就开始了这一领域的研究,而现在被广泛应用的人工耳蜗,也正是脑机接口技术的产物。
就像面对所有的新技术时,比起一些疯狂泼冷水的言论,我们更需要一些理性的推动者。