AI领域40多年，真正不变的是什么？-深圳市維司達科技有限公司

AI领域40多年，真正不变的是什么？

零一万物CEO李开复与AI老兵Tom Mitchell的深度对谈

从隐马尔可夫模型到Transformer，从语音识别到大语言模型，技术范式一直在变。但推动AI进步的本质，从未改变。

一、起点：一个改变一生的选择

1979年，年轻的李开复进入哥伦比亚大学，对人工智能产生了浓厚兴趣。

“AI是人类认识并理解自己的最后一里路。”

他认为，探索大脑工作机制，就是在回答一个更重大的问题：我们能否创造出比肩人类的智能体？

带着这个梦想，李开复来到卡内基梅隆大学（CMU）攻读博士。在这里，他遇到了一个关键选择——做主流的专家系统，还是走一条没人验证过的路？

二、突破：勇敢走不同的路

当时的背景

1980年代，语音识别领域的主流路线是专家系统：让人类专家定义规则，教机器如何识别语音。

但李开复通过朋友接触到了另一条路线：隐马尔可夫模型（HMM）——一种基于概率统计的机器学习方法。

导师的一句话，改变了一切

李开复去找导师Raj Reddy，说：“我尊敬您，但我想尝试一种不同的方法——用隐马尔可夫模型。”

Raj回答了一句非常了不起的话：“我不同意你，但我会支持你。”

这句话让李开复终身受益。他后来总结：

“AI的突破很少来自孤立的灵感。真正改变历史的，是有人敢走不同的路。”

成功的三要素

李开复拿到了做研究需要的三样关键资源：

海量数据：“没有任何数据能胜过更多的数据。”（IBM研究员Fred Jelinek的名言，李开复至今深信不疑）
强大算力：20台SPARCstation，在当时是惊人的算力
自由探索：导师的支持，让他可以追求自己真正有热情的方向

96%准确率的震撼

经过一系列改进（优化模型结构、采用更好的信号处理、引入语言模型），在一个周六早晨，李开复发现系统准确率达到了96%。

“技术突破往往不是单点奇迹，而是模型结构、数据表示、上下文建模、数据规模和计算资源等多个正确方向同时叠加后的结果。”

三、演进：AI技术的三次跃迁

第一次跃迁：从HMM到深度学习

李开复的博士论文让HMM成为语音识别的行业标配。但几年后，基于HMM的改进逐渐变慢。

“靠这套方法无法真正到达终点。”

下一次突破来自深度学习。当Geoffrey Hinton利用李飞飞的ImageNet数据库证明深度学习可以打破计算机视觉基准后，语音识别也迎来飞跃。

关键洞察：神经网络的想法一直存在，只是过去没有足够算力训练足够大的网络。当层数增加、数据规模扩大、算力增强后，性能就大幅提升。

第二次跃迁：从深度学习到Transformer

再往后，就是今天我们熟悉的Transformer和大语言模型。

核心进步：

过去：二元语法、三元语法（只能看前一两个词）
现在：Transformer可以关注上百万个词的上下文，并通过注意力机制进行选择性处理

不变的底层逻辑

回顾AI技术演进，李开复认为关键始终在于四件事：

要素	作用	例子
模型架构	定义如何处理信息	HMM → 深度学习 → Transformer
海量数据	让机器真正"理解"	“没有数据能胜过更多的数据”
强大算力	训练更大规模的模型	20台SPARCstation → GPU集群
处理上下文的能力	理解复杂关系	看1-2个词 → 看100万个词

四、惊喜：过去5年最震撼的事

李开复说，最大的惊喜有三个：

1. Transformer架构竟然能带我们走得如此之远

他是GPT-2的早期测试者，当时就意识到Transformer会带来巨大提升，但**“没有料到它能像今天这样扩展得如此庞大、深入”**。

2. Scaling Law（缩放定律）竟然能持续奏效如此之久

模型越大、数据越多、算力越强，性能就越好——这个规律竟然一直成立。

3. 强化学习终于发挥了关键作用

经过多年蛰伏，强化学习在大语言模型时代终于展现出巨大价值。

一个有趣的观察：经验可能是负担

李开复坦承：

“我被过去那种长期缓慢发展的节奏给’毒害’了，所以我花了一段时间才适应这个快节奏。”

那些在生成式AI时代长大的20多岁的年轻人，思想完全是"未被约束"的。他们就像李开复当年很幸运地在机器学习领域未被更早期的"专家系统"约束一样。

“AI的历史不是一条直线，而是一代人不断推翻上一代人的确定性。”

五、未来：接下来会发生什么？

近期突破（3-4年内）

李开复预测：

AI做出突破性的科学发现——不会让人惊讶
三四年内，AI领域就会出现诺贝尔奖级别的突破（真正被授予诺贝尔奖可能需要更长时间）

长远影响

一旦AI能加速科学发现，它带来的将不只是效率提升，也可能推动：

健康寿命延长
物质财富增加
更多人类难题的解决

六、给年轻研究者的建议

如果有即将入学的计算机科学与AI专业博士生问李开复该怎么做，他会给出这样的建议：

情况一：想参与当前的主流突破

寻找那些与拥有大量计算资源的企业有合作关系的教授。

原因：今天基于Transformer的生成式AI要继续发展，必须建立在庞大算力基础设施之上，而多数纯学术机构并不具备这样的条件。

情况二：寻找下一个范式

打破常规，寻找Transformer之外的下一个范式。

“当所有人都在优化答案时，总要有人重新定义问题。”

如果没有充足计算资源，很难在谷歌或OpenAI的主战场上击败他们。但你可以做他们还不知道怎么做的事——去构建或发明下一个Transformer，或者下一代强化学习机制。

关键洞察：

AI领域真正稀缺的，从来不是共识，而是能被验证的非共识。
那些在谷歌崛起后仍固执己见做传统信息检索的人，最终走进了死胡同。
学术界的光明未来，必须脚踏实地。

七、结语：不变的本质

回到文章开头的问题：AI领域40多年，真正不变的是什么？

答案不是某个具体的技术、某个模型、某个算法，而是：

不变的四大底层变量

数据：从"没有任何数据能胜过更多的数据"，到今天的大语言模型训练语料
算力：从20台SPARCstation，到今天的GPU集群和数据中心
模型架构：从HMM到深度学习到Transformer——形式在变，但"如何更好地处理信息"这个问题不变
真实问题：技术最终要解决的问题——让机器真正理解人类

不变的精神

敢于走不同的路：Raj的那句"我不同意你，但我会支持你"
用结果说话：技术路线之争，不是靠辩论赢的，是要靠结果赢的
一代人推翻一代人的确定性：AI的历史不是直线，而是不断颠覆的过程

文章来源：零一万物 01AI
责编：林洁

希望这篇文章能帮助你理解AI技术演进的背后逻辑，以及那些真正推动进步的不变量。技术的进步或许很快，但有些东西，始终未变。

AI领域40多年，真正不变的是什么？