2.2 黄金年代(1956-1974):推理证明、感知机与早期乐观主义
以1956年达特茅斯会议为起点,至1970年代中期,人工智能领域进入了其第一个繁荣阶段,常被称为“黄金年代”。这一时期,研究者在符号推理、机器学习雏形及自然语言处理等方向上取得了系列突破性进展,并普遍弥漫着一种乐观主义情绪,认为人类水平的机器智能将在数十年内实现。然而,这一乐观主义背后所隐藏的理论局限与技术瓶颈,也为随后到来的“寒冬”埋下了伏笔。
2.2.1 符号主义的辉煌:推理、搜索与“物理符号系统假说”
在黄金年代,以逻辑和符号操作为核心的“符号主义”范式占据绝对主导地位。其核心信念是:智能行为可以通过对内部显式符号表示进行形式化逻辑操作而产生。这一范式取得了两项里程碑式成就。
1. 逻辑理论家与通用问题求解器
1956年,艾伦·纽厄尔、赫伯特·西蒙和J. C. 肖合作开发了“逻辑理论家”程序。该程序能够自动证明怀特海和罗素《数学原理》第二章中的数理逻辑定理[1]。其革命性意义在于:
- 首次实现机器自动推理:LT并非通过穷举,而是采用“启发式搜索”策略,模拟人类在证明过程中尝试各种可能路径并回溯的方法。
- 催生“物理符号系统假说”:基于LT等工作的成功,纽厄尔和西蒙于1976年正式提出这一强AI的核心假说:“物理符号系统具有必要且充分的手段来实现一般的智能行动。”[2] 该假说断言,任何表现出一般智能的系统,其本质必然是一个物理符号系统;反之,任何一个足够强大的物理符号系统,都可以通过编程表现出一般智能。这为整个符号主义AI提供了理论基础和研究纲领。
在LT之后,纽厄尔和西蒙于1957年开发了更通用的“通用问题求解器”(GPS)。GPS首次明确引入了“手段-目的分析”这一通用问题求解策略:通过比较当前状态与目标状态的差异,选择能减少差异的操作,递归执行直至达成目标[3]。GPS被应用于多种领域(如谜题、积分),证明了基于通用搜索策略和符号表示的“通用问题求解”理念的可行性。
2. 搜索与知识表示范式的确立
此阶段的研究确立了基于状态空间搜索的问题求解范式。问题被形式化为初始状态、目标状态、操作符(引起状态变迁的规则)及路径代价。求解过程被视为在状态空间图中寻找一条从初始状态到目标状态的路径。以八数码 puzzle 为例,其状态空间由棋盘的9!9!9!种排列组成,操作符为空格的上、下、左、右移动。
状态空间搜索的核心是寻找操作序列⟨o1,o2,...,on⟩使得S初始→o1,o2,...,onS目标 \text{状态空间搜索的核心是寻找操作序列} \quad \langle o_1, o_2, ..., o_n \rangle \quad \text{使得} \quad S_{初始} \xrightarrow{o_1, o_2, ..., o_n} S_{目标}状态空间搜索的核心是寻找操作序列⟨o1,o2,...,on⟩使得S初始o1,o2,...,onS目标
A*等启发式搜索算法的出现,通过引入对目标距离的启发式估计h(n)h(n)h(n),极大提升了搜索效率,其估价函数为f(n)=g(n)+h(n)f(n) = g(n) + h(n)f(n)=g(n)+h(n),其中g(n)g(n)g(n)是从起始节点到节点nnn的实际代价[4]。搜索范式和知识表示(如谓词逻辑、语义网络、框架)成为AI教科书的标准内容,其影响持续至今。
2.2.2 连接主义的初啼:感知机的兴起与明斯基的批判
与符号主义并行发展的,是源于麦卡洛克-皮茨模型的连接主义路径。其黄金年代的代表是弗兰克·罗森布拉特提出的“感知机”。
1. 感知机模型与学习规则
1958年,罗森布拉特在《心理学评论》上正式提出了感知机模型[5]。它不仅是第一个具有自学习能力的神经网络模型,更是一种模拟感知和模式识别过程的生物启发式计算模型。
- 结构:典型的感知机为三层结构——输入层(感受器)、连接层(关联单元,权重可调)、输出层(响应单元)。
- 学习算法:罗森布拉特提出了感知机收敛定理,并给出了权重调整的迭代规则。对于二分类问题,给定一个输入样本x⃗\vec{x}x及其期望输出ddd(+1或-1),感知机的实际输出为y=sgn(w⃗⋅x⃗+b)y = \text{sgn}(\vec{w} \cdot \vec{x} + b)y=sgn(w⋅x+b),权重更新规则为:
w⃗new=w⃗old+η(d−y)x⃗\vec{w}_{new} = \vec{w}_{old} + \eta (d - y) \vec{x}wnew=wold+η(d−y)x
其中,η\etaη为学习率。该规则表明,当预测错误时,权重向使正确分类更可能的方向调整。罗森布拉特从数学上证明了,如果训练数据线性可分,该算法保证在有限步内收敛到一个解[5]。
2. 轰动与局限性
感知机一度引发巨大轰动,罗森布拉特和资助方美国海军曾做出乐观预测。《纽约时报》报道称其是“能够行走、交谈、观看、书写、自我复制并知晓自身存在的电子计算机的雏形”[6]。然而,其根本局限在于,单层感知机本质上是一个线性分类器,只能解决线性可分问题。对于经典的“异或”问题,单层感知机无法求解。这一局限性在1969年马文·明斯基和西摩·帕佩特出版的《感知机》一书中被系统而深刻地剖析[7]。他们从数学上严格证明了单层感知机的功能局限,并悲观地指出,即便引入多层网络,当时也缺乏有效的训练算法。这本书的出版被广泛认为是导致连接主义研究陷入近二十年低潮的直接原因之一。
2.2.3 早期的自然语言处理与微世界研究
在自然语言处理方面,黄金年代见证了两种风格迥异的研究路径。
- 基于规则的句法分析:以乔姆斯基的形式语言理论为基础,研究者试图通过编写复杂的语法规则来让计算机理解句子结构。诺姆·乔姆斯基的转换1生成语法极大影响了这一时期的NLP研究[8]。
- “关键字”匹配与简单对话:约瑟夫·魏泽鲍姆于1966年开发的ELIZA程序代表了另一条实用路径[9]。ELIZA模拟一位罗杰斯派心理治疗师,它并不“理解”对话,而是通过简单的模式匹配(如识别用户句子中的关键词“母亲”),从预定义的脚本中选取相应的回应模板(如“告诉我更多关于你家庭的事”)。尽管魏泽鲍姆本人旨在展示人机交互的表面性,但ELIZA的受欢迎程度却意外揭示了公众对AI对话能力的热切期待和易于满足。
与此同时,为了在可控环境中集中研究智能的核心问题(如知识表示、推理、规划),研究者创造了“积木世界”等微世界。例如,特里·维诺格拉德于1972年开发的SHRDLU程序,能够在一个虚拟的积木世界中,通过自然语言指令操纵机械臂移动不同颜色的积木,并能回答关于这个世界的状态和自身行为的问题[10]。SHRDLU集成了句法分析、语义解释、规划与推理,展示了在一个受限领域中实现深度语言理解和智能行为的可能性,成为微世界研究的典范。
2.2.4 乐观主义的根源、表现与内在局限
这一时期普遍存在的乐观主义,其根源与表现如下:
- “大人物”的公开预测:多位奠基者做出了大胆预测。赫伯特·西蒙在1965年宣称:“二十年内,机器将能胜任人类所能从事的任何工作。”[11] 马文·明斯基在1970年表示:“在三到八年的时间里,我们将研制出具有普通人一般智能的机器。”[12]
- 快速的技术突破:从无到有地实现了定理自动证明、问题求解、模式识别和简单对话,这些突破给人以指数级进步的错觉。
- 对智能本质的乐观简化:“物理符号系统假说”将智能等价于符号操作,忽略了感知、常识、学习等困难的“接地”问题。微世界研究的初步成功,使研究者低估了将系统扩展到复杂、混乱、开放的现实世界所面临的巨大挑战。
然而,这种乐观主义建立在对问题复杂性的严重低估之上。其内在局限包括:符号系统面临的“组合爆炸”问题(搜索空间随问题规模指数级增长);感知机等连接主义模型能力有限且缺乏扩展性;以及最关键但未被充分认识的“常识知识”问题——人类拥有的海量、模糊、情境相关的背景知识,难以用形式化符号系统完整刻画和获取。
本章节核心知识点总结
- 符号主义范式主导:以“逻辑理论家”和“通用问题求解器”为代表,确立了基于物理符号系统假说、状态空间搜索和启发式方法的问题求解范式,这是黄金年代AI研究的主流。
- 连接主义的重要尝试:罗森布拉特的感知机首次实现了具有学习能力的神经网络模型,引发了早期热潮,但其作为线性模型的根本局限(无法解决异或等非线性问题)被明斯基和帕佩特在《感知机》一书中系统批判,直接导致该路径此后长期停滞。
- 自然语言与微世界探索:NLP研究分化为基于复杂规则的句法分析和基于简单模式匹配的实用对话(如ELIZA);微世界研究(如SHRDLU)则在受限环境中成功整合了语言、推理与行动,展示了AI的潜力,但也暴露了其领域局限性。
- 早期乐观主义及其基础:奠基者们基于早期突破做出了过于乐观的预测,其根源在于将智能简化为符号操作,并低估了组合爆炸、常识知识以及从微世界向真实世界扩展的极端困难性,这些未解决的深层问题为随后的“AI寒冬”埋下了伏笔。
参考文献
[1] NEWELL A, SHAW J C, SIMON H A. Empirical explorations of the logic theory machine: a case study in heuristics[C]//Proceedings of the March 1-3, 1955, Western Joint Computer Conference. Los Angeles: ACM, 1957: 218-230.
[2] NEWELL A, SIMON H A. Computer science as empirical inquiry: symbols and search[J]. Communications of the ACM, 1976, 19(3): 113-126.
[3] NEWELL A, SIMON H A. GPS, a program that simulates human thought[M]//FEIGENBAUM E A, FELDMAN J. Computers and thought. New York: McGraw-Hill, 1963: 279-293.
[4] HART P E, NILSSON N J, RAPHAEL B. A formal basis for the heuristic determination of minimum cost paths[J]. IEEE Transactions on Systems Science and Cybernetics, 1968, 4(2): 100-107.
[5] ROSENBLATT F. The perceptron: a probabilistic model for information storage and organization in the brain[J]. Psychological Review, 1958, 65(6): 386-408.
[6] New navy device learns by doing: psychologist shows embryo of computer designed to read and grow wiser[N]. The New York Times, 1958-07-08(25).
[7] MINSKY M, PAPERT S. Perceptrons: an introduction to computational geometry[M]. Cambridge: The MIT Press, 1969: 1-19.
[8] CHOMSKY N. Syntactic structures[M]. The Hague: Mouton & Co., 1957.
[9] WEIZENBAUM J. ELIZA—a computer program for the study of natural language communication between man and machine[J]. Communications of the ACM, 1966, 9(1): 36-45.
[10] WINOGRAD T. Understanding natural language[J]. Cognitive Psychology, 1972, 3(1): 1-191.
[11] SIMON H A. The shape of automation for men and management[M]. New York: Harper & Row, 1965: 96.
[12] MINSKY M. Form and content in computer science[J]. Journal of the ACM, 1970, 17(2): 197-215.