无论如何努力,脑科学家和认知心理学家都不可能在人脑中找到贝多芬第五交响曲的副本,也不可能找到记录文字、图片、语法或其它外界刺激的副本。诚然,人脑并非真的空空如也,但大多数我们认为它“拥有”的东西并不真的“存在”其中;甚至简单如“记忆”,也不存在。
我们对大脑拙劣认识有着深远的历史根源。不过,上世纪四十年代,计算机的问世让我们的认识变得尤为混乱。半个多世纪以来,不断有心理学家、语言学家、神经学家和其他研究人类行为的专家宣称,人脑有着和计算机一样的工作方式。
细想一下婴儿的大脑,就能看出这个观点有多么无稽。人类新生儿和其它哺乳动物的幼崽一样,一出生就为和这个世界互动做好了准备,这是演化的结果。婴儿的视力虽然模糊,却会特别注意人脸,很快就能辨认出自己的母亲。他们对语言比对一般的声音更加敏感,而且能够分辨出不同人的语音。我们的身体专门是为社交打造的。
健康的新生儿还拥有十几套神经反射,它们是针对生死攸关的特定刺激预设的身体反应。比如,他们会把头转向触碰到面颊的物体,或是吮吸放进嘴里的东西。新生儿也会在水下自动屏住呼吸;紧紧抓住送到手里的物体——用力之大几乎可以支撑起他们自己。不过最重要的是,他们天生就有强大的学习机制,这让他们能够迅速改变。因此,即使世界已经变得和先祖时候全然两样,他们依然能够迅速地让自己与外界的互动变得愈发高效。
感觉、反射、学习机制:我们生来就具有类似能力,想想看还挺不少。如果我们出生的时候缺少其中某种,恐怕就很难活下来。
但下面这些东西都不是我们与生俱来的:信息、数据、规则、软件、知 识、词库、表示、算法、程序、模型、内存、图形、处理器、子程序、编码器、译码器、符号、缓存等等。这些都是计算机智能化的设计要素。我们不但生下来就没有这些东西,而且一生都不会发育出来这些东西。
我们不存储词汇和运用词汇的规则;受到视觉刺激时,我们不会创建它的表示(representations),并存储在一个短期缓存中,再转移到长期记忆的设备里;我们也不会从内存寄存器里检索信息、图像或文字。这些都是计算机的做法,而生物不这样做。
计算机切实地处理信息:数字、字母、文字、公式、图像。首先,信息经过编码,转化为计算机可用的格式,也就是由“ 0 ”和“ 1 ”(称为“ 位 ” 或 “比特”)组合成的一小段一小段的组块(“字节”)。我的计算机里每个字节含有 8 个位,这些位的某种组合模式表示字母“ d “,另一种模式表示字母“ o ”,再一种是“ g ”。这三个字节串联起来组成单词“ dog ”。而图片(比如桌面上我的猫“的照片)则是由百万级的字节(称为“兆字节”)按某种特殊的模式排列表示的。这些字节前后还有一些特殊字符,告诉计算机它们是图片而不是文字。
计算机切实地将这些模式从一个物理存储区转移到另一个,把它们写入到电子元件上。有时计算机会复制这些模式,有时它们会改变这些模式,比如当我们更正稿件或是修改图片时。计算机在移动、复制和操作数据组时遵循的规则也存储在计算机内部。这样的规则集合称为“程序”或“算法”,而一套协助我们进行某项工作(比如购买股票或网上交友)的算法则称为“应用(Application)”——也就是当下很多人口中的“ APP ”。
原谅我介绍了这么多计算机原理,不过我需要明确这样一点:计算机操作的是符号表示 (symbolic representations ) 。它们真正地存储、检索,处理数据(process)。它们有物理内存。它们的任何操作都受算法引导,无一例外。
人类则并非这样:从来不是、永远也不会这样。现实如此,为什么还是有这么多科学家在讨论精神活动时把人看成计算机呢?
二
人工智能专家乔治·扎卡达基斯(George Zarkadakis)在 2015 年出版的 In Our Own Image 一书中,叙述了过去两千年来在解释人类智能采用过的六种比喻。
最早的一种终究在《圣经》里:人类是用尘土塑成,智能的神将他的灵注入其中。这个灵(至少从语法上看)“解释”了我们智能。
公元前三世纪水利设施的出现使得一种用水利模型解释人类智能的学说大行其道。此说运用人体内的各种液体流(即“体液”)解释我们的物理动作和心理活动,前后延续1600多年,阻碍了期间医学实践的发展。
十六世纪初出现了以发条和齿轮传动为动力的自动机,这个发明激发了当时顶尖思想家(如笛卡尔)的灵感,他们宣称人是复杂的机器。十七世纪初,英国哲学家霍布斯提出了思想源于脑内微小机械运动的观点。进入十八世纪,电和化学方面的发现又引发出人类智能的新理论,这些理论实质上依旧多为比喻性的。而到了十九世纪中叶,德国物理学家亥姆霍兹有感于当时最新的通信发展,将人脑比喻成了电报机。
这些比喻性理论都反映当时相关的最新思想。可以想见,上世纪四十年代计算机科技出现之后,不出几年就有了人脑像计算机一样运作的说法:大脑是硬件,思想则是软件。我们今天称为“认知科学”的这门学科,其建立的标志性事件是1951年心理学家乔治·米勒(George Miller)Language and Communication(《语言与交流》)一书的出版。米勒提出,我们可以利用信息理论、计算学和语言学中的概念对心理世界进行充分的研究。
这类思想,在数学家冯·诺依曼 1958 年出版的《计算机与人脑》(The Computer and the Brain)这本小册子里发展到了极致。冯·诺依曼在书中断言,人类神经系统的功能是“表面数字式的”。尽管他承认自己对人脑在推理和记忆上的功能不甚了了,但他还是罗列出一条条当时的计算机和人脑的相似之处。
在计算机技术和脑科学研究进一步发展的推动下,充满野心的、通过多学科理解人类智能的工作渐渐开展起来。它立足在人类是计算机式信息处理器的思想之上。目前,有数千名研究者投身其中,花费的经费以数十亿美元计,产生出大量的或专门或综合的论文和书籍。雷·库兹韦尔(Ray Kurzweil)2013 年出版的 How to Create a Mind: The Secret of Human Thought Revealed(《如何创造思维:揭开思想之谜》)就是一个代表。这本书推测了人脑的“算法”,并解释人脑如何“处理数据”,甚至还讨论了人脑从表面上看其结构与集成电路的相似性。
如今,“信息处理说”(information processing metaphor)已经主导了大众和学界对人类智能的认知。就像任何特定时期和文化下关于人类智能行为的讨论都不能脱离相关的神灵一样,现实中任何的相关的讨论都已经离不开这个学说。现在人们普遍认可它,而无人置疑。
但信息处理说终究是一个比喻,是我们为了理解一个我们并不真正理解的东西而讲述的故事。它和先前所有的比喻一样,终有一天也会被我们抛开——要么被另一个比喻,要么最终被真正的知识取代。
就在一年多以前,我访问了一家世界上最负盛名的研究所。我试探性地让那里的研究人员不使用任何信息处理说的概念来解释人类智能行为,结果他们做不到。后来我又在邮件交流中礼貌地提出这一问题,几个月里他们还是没什么进展。他们意识到了这个问题,对这个挑战也并非不屑一顾,但他们没有别的替代品。换句话说,信息处理说已经“根深蒂固”,它的用语和观念太过强大,让人难以回避,因而妨碍了我们思考。
信息处理说的错误逻辑很容易就能说明白。它建立在一个错误的三段论上,由两个合理前提得到一个错误结论。合理前提 1:所有的计算机都能表现得智能。合理前提 2:所有计算机都是信息处理器。错误结论:所有具有智能表现的实体都是信息处理器。
通俗地说,因为计算机是信息处理器,所以人类也必须是信息处理器:这样的观点实在很蠢。等到哪天信息处理说被最终抛弃,后世的历史学家想必也会像我们现在看待水利说和机械说那样,觉得这个学说很荒谬吧。
既然信息处理说这么蠢,那它为什么还这么根深蒂固?我们为什么不能像扫除挡在路上的树枝那样抛弃这个学说,是什么妨碍着我们?有什么方法能够让我们放开这根不靠谱的手杖,走向理解人类智能之路?我们为长久以来依赖这根手杖付出了什么代价?信息处理说终究是引导着几个领域里大量的研究者进行了几十年的写作和思考,我们的损失有多少呢?
这些年我进行过很多次这样的课堂实验:首先找一个学生上台,让他/她在黑板上“尽可能详细地”画出一美元纸币的样子。画完之后,用一张白纸盖住,然后从钱包里拿出一张一美元纸币贴在黑板上,让他/她照着再画一张。完成后,揭开第一张图上的白纸,让全班讨论两幅图的差异。
你也许没见过这样的实验,或是想象不出结果如何,所以我让学院里的一位实习生吉妮·西姆(Jinny Hyun)画了两张。这是她“凭记忆”(注意“记忆”被类比为计算机“内存”)画的图: