第一节人工智能对大脑及其思维的模拟
按照一般的理解,所谓人工智能(artifitelligence,简称AI),就是用人工的方法在机器上实现的智能;这类机器通常是指计算机。尽管这类机器的大部分在它们被设计出来的早期并没有明确的模拟人类认知加工的意图,但在它往后的发展中的确是以模拟人类大脑的神经机制和思维活动为主要内容的,即有意识地依据认知心理学、认知神经科学、脑科学、思维科学等的研究成果,模拟神经元和大脑的活动过程以及人类在推理、证明、识别、理解、学习、规划以及问题求解中的种种“智能”行为。下面做一简要概述。
早在1950年,英国数学家、逻辑学家图灵(A。Turing)发表了《计算机和智能》一文,明确提出了计算机经程序化后能表现出与人一样的智能行为的观点。在图灵看来,人的大脑就像一台“数字计算机器”。机器能够通过智能行为的测试,本身就说明机器具有智能,计算是思维的一种形式。1958年,美籍匈牙利数学家、计算机科学家冯·诺依曼(J。VonNeuman)出版了《计算机与人脑》一书。在书中,作者从一个数学家的角度将计算机与神经系统进行类比。认为混合计算机中的“模拟”计算与“数字”计算的综合,与神经系统的特点相符。他说:“基因本身就是数字系统元件的一部分。不过基因所产生的一切效应,以及刺激形成的某些特别的化学物质也包含在内,也就是各种特定的酶(它是基因的标志),这些都在模拟的范畴之内。这正是模拟与数字过程相互演变的一个尤为明显的例子。”[1]同时他认为,人工智能促进了物理学与数学的融合。因为很明显,神经元的激活与传导是遵循“全”或“无”的过程进行的。这与计算机中导线的“全”或“无”传导机制(导线不是有电流脉冲,就是没有电流脉冲),是高度相似的。而且这两种情形能够与传统的二值逻辑、二进制符号系统联系起来。美国计算机科学家、控制论者M。A。阿尔贝勃在《大脑、机器和数学》(1964)一书中也乐观地指出:“我当然不相信数学会解决生理学和心理学的一切问题,但是我相信数学推导方法在理解大脑方面也一定会和神经生理学和心理学的实验与临床研究一样重要,就像数学方法已经帮助电气工程师造出计算机一样。虽然计算机比生物体在复杂度上要低许多数量级,但是,至今它还是大脑最好的模型。”[2]为此,人工智能科学家的一个著名口号是:“心灵之于大脑正如软件之于硬件”。
人工智能科学家西蒙等人将上述研究概括为物理符号研究范式。他说:“计算机显然是一个物理符号系统。它的物理性质和运转方式可以很容易地证明它完成这些过程(仅有的这些过程)的能力。人的大脑也是(但并非显而易见)一个物理符号系统。它无疑能完成列入这种系统界定范围内的那些过程。”[3]由于该范式假设人类智能的基本载体是符号,认知过程就是符号表示下的符号计算与操作,思维实质上就是计算,因而在智能模拟过程中,它们更多的是注意到计算机运行和操作与人类智能和脑神经组织的某种相似性。换言之,只是注意到计算机在符号计算、句法逻辑方面与人的某些智能的相似性,而忽视了人类大脑神经元之间的突触联结数量的海量性及并行加工处理方式的复杂性等特性,这样,物理符号主义模型对大脑的神经机制的刻画显得过于简单化了:它至多只是在某些功能方面建立了计算机与人类智能或人脑之间的联系,而与实际的人类智能和大脑神经活动机制,相差甚远。
为了缩小物理符号主义模型与真实人类智能和人脑的距离,特别是要能体现人脑并行式处理信息的突出特点,一些计算机科学家、神经生理学家和数学家尝试运用“仿生学”的方法,从脑的生理结构原型出发,致力于建构不同层次的关于脑的硬件结构系统(模型)。当然,这项复兴于20世纪80年代的工作可追溯到20世纪40年代就已经开始的某些早期研究。这些研究主要体现在神经生物学家W。麦卡洛克和他的学生W。皮茨于1943年发表的具有划时代意义的《神经活动内在概念的逻辑运算》一文中。该文认为,任一神经元的响应事实上都等价于提出了一个使神经元受到充分刺激的命题,而这个命题可以用符号逻辑来标记。受此启发,1949年,神经生物学家赫布(D。O。Hebb)提出著名的“Hebb法则”。其基本思想是,如果两个神经元都处于兴奋(激活)状态,它们之间的突触联结强度就会得到增强。而突触联结强度的可变性是学习和记忆的基础。赫布还给出了突触调节模型,描述了分布式记忆过程。1958年,计算机科学家罗森布拉特(E。Rosenblatt)基于M&P(麦卡洛克和皮茨的神经元模型),建构了感知器模型。在这个模型中,输入和输出层之间的权重调节正比于计算输出值与期望输出值之差。1969年,美国人工智能专家明斯基和帕伯特(S。Papert)对罗森布拉特的工作进行了深入研究,出版了《感知机》一书。在该书中,作者认为,通过引入隐含神经元,增加神经网络的层次,可以提高神经网络的处理能力。1982年,美国物理学家J。霍普菲尔德提出了一种新的神经网络模型——Hopfield神经网络(HNN)。1986年,J。卢姆哈特(J。D。Rumelhart)等在多层神经网络模型的基础上,提出了多层神经网络模型的反向传播学习算法(BP算法),解决了多层前向神经网络的学习问题,证明了多层神经网络具有很强的学习能力。所有这些,构成了人工智能领域中的新的研究范式——联结主义()或仿生学派(bionicsism)。
联结主义范式假定人类智能的基本单元是神经元,认知过程是由神经元构成的网络信息传递实现的,并且这种传递是并行和分布式的。其原理主要是神经网络及神经网络间的连接机制与学习算法。从这个意义上说,联结主义相比于物理符号主义来说,更接近于人脑神经活动的机制和过程。而且,联结主义模型在特征提取、模式分类、联想记忆、低层次感知、自适应控制等场合,优势更为明显。例如,联结论的模型既没有中央处理器(CPU),也没有存储程序;它的知识表征和语义获得是在外部输入和输出的双重调节下,经过内部隐含层的权重改变而获得的。因而,联结论的知识表达一直处在动态过程当中。这个动态过程我们可以看作是一个经过学习和训练而形成的自我执行过程。因此,联结主义计算机通过使用一系列的指令控制某些计算过程,而有别于传统计算机的“程序”概念。[4]目前,人工神经网络研究不仅向综合性发展,而且越来越与其他领域密切结合起来。如把多层感知器与自组织特征联系起来,发展出性能更强的结构。尽管如此,联结主义的研究范式和模型仍然与真实的人类智能和大脑有相当的距离。这种距离表现在,神经元与计算机的单个单元并不是完全对应的;人脑并不总是具有联结主义模型的表现;许多联结主义的模型都有很多不同的功能层次,但是大脑似乎有着更为复杂的物理—几何分层、连接和投射机制等。就规模来说,人脑所具有的神经元联结权重也是计算机网络完全无法比拟的。在这种情况下,“尽管联结论在总的方面是关心生物学上的可实现性的,但是大多数联结论系统所做的并不是神经实现方式的模型,而是抽象定义的信息处理的模型”[5]。
不过,联结主义的研究范式至少开辟了一条整体论的研究道路,给后来的研究以启迪。如H。哈肯主张运用他所创立的协同学原理从宏观层次(神经元群)上揭示大脑的神经动力机制。他认为是序参量决定了脑的宏观模式,而序参量表征在三层神经网络中的隐含层当中,它支配着完全不同的外部输出。[6]认知科学家保罗·丘奇兰德强调从神经元的层面或神经元群的层面上来研究神经系统的主要组织特征。他认为,如果我们把一个整体的理论解释为突触权重的整体配置,那么没有由特定权重配置所处理的向量,就不会发生任何认知活动。
在模拟神经元和大脑神经组织活动机制的同时,人们也在考虑从大脑思维活动层面来进行模拟。毕竟,计算机模拟的目的是获取知识。为此,人们注意到,人类的许多思维活动是无法形式化的。例如,形象性的描述、创造性的灵感、或然性的推断等。有人将这种无法形式化、并与形式化思维相对的思维称之为“叙述思维”。认为这种思维使用的是暗含的假设、似然的或习惯的组合方法,其作用是使我们在现实世界中有一个合理的行为;其特征是开放的、语义的。在计算机操作层面,其操作形式与形式化思维是不一样的。[7]不过,叙述思维与形式思维并非截然对立的,两者之间的界线也是变动的;人工智能的目的正是通过叙述思维的长处来弥补形式化思维的不足,例如,确定形式推导过程中的先后次序、目标,给推理结果以一定的意义等,并不断地将叙述思维模式化。
钱学森早在1980年就前瞻性地指出:“我们要把逻辑学扩大为思维学,包括一部分我们已经研究得很多而且很有成绩的逻辑思维,还要包括其他人的思维。这在国外已逐步地引起重视,他们是从搞机器人、人工智能这方面考虑的,……这个理论他们叫认知科学(itivesces),我们用‘思维科学’(ices)。更确切一点,就是包括逻辑思维,也包括各种思维过程,形象思维等。”[8]1995年,他又指出:“逻辑思维,微观法;形象思维,宏观法;创造思维,微观与宏观结合。创造思维才是智慧的源泉,逻辑思维和形象思维都是手段。”[9]并再次强调,形象思维不仅是思维科学研究的突破口,也是人工智能模拟的突破口。我认为,这里说的形象思维、创造性思维与“叙述思维”,本质上是一致的。
事实上,人类大脑两半球的神经机制与思维活动是紧密相关的。通常认为,大脑左半球长于序列的、一个步骤接着一个步骤的思维,右半球则倾向于运用平行的方式进行思维。这似乎分别与传统AI的串行工作方式以及联结论的并行工作方式相对应。不过,这确实有合理的依据,仅从思维功能的角度来看,传统AI似乎更多的是模拟人类的左脑,联结论的神经网络则更多的是模拟人类的右脑。[10]正如国内人工智能科学家戴汝为所指出的:“抽象思维的推理过程由微观单元过程所组成,它体现为一步一步推理的规律。这种微观单元过程视为经典的一阶逻辑。由一阶逻辑的许多单元过程组成一阶思维系统。”[11]而“联结机制是有模拟人的形象思维的功能,它具有形象思维所具有的一些性质。通过同形象思维作比较,它能为人们认识形象思维提供一条有效的途径”[12]。很明显,如果这一结论能够从神经机制层面加以确证与甄别,的确能够起到以简驭繁的功效。只是与右半球神经构造相联系的形象思维仍然是智能模拟的难点。其主要原因在于,这部分的思维活动并非都是算法的,且常常具有非语言的特征。[13]同时,并不仅仅局限于右脑(也有部分左脑和身体动作参与)的灵感思维、情境思维、情感思维、动作思维、创造性思维以及社会思维等,也不能完全归结为算法形式和逻辑句法。用R。布鲁克斯(RodneyBrooks)话来说,它们是“无表征的”。
已经有学者从模拟左右脑的整体功能角度提出智能科学研究的新思路。如学者韩力群、涂序彦(2009)借鉴人脑高级中枢神经系统的协调机制(主要是大脑两半球功能的不对称性及通过胼胝体实现的协调互动机制),将传统人工智能技术长于符号运算和逻辑推理的功能与右脑长于模糊处理和并行化处理的能力这样两大优势统一起来,提出建立多类型的人工神经网络综合集成系统的构想。[14]2008年,反映人类大脑皮层中负责高级思维的数百万神经纤维如何互相连接和分布式处理信息的完整的大脑网络地图已经成功获得;对于左右脑半球的工作至关重要的一个大脑单一网络核心也已确定。这对人工神经网络的建构是一个良好的基础。[15]
总之,人工智能通过计算机模拟智能的过程和行为,加深了人们对人脑功能和智能本质的认识和理解,人们对大脑的看法与以往已经有了明显的不同。还是明斯基说得好:“正如进化论改变了我们对生物的看法一样,人工智能也将改变我们关于脑的看法。”[16]