AI领域40多年,真正不变的是什么?
零一万物CEO李开复与AI老兵Tom Mitchell的深度对谈
从隐马尔可夫模型到Transformer,从语音识别到大语言模型,技术范式一直在变。但推动AI进步的本质,从未改变。
一、起点:一个改变一生的选择
1979年,年轻的李开复进入哥伦比亚大学,对人工智能产生了浓厚兴趣。
“AI是人类认识并理解自己的最后一里路。”
他认为,探索大脑工作机制,就是在回答一个更重大的问题:我们能否创造出比肩人类的智能体?
带着这个梦想,李开复来到卡内基梅隆大学(CMU)攻读博士。在这里,他遇到了一个关键选择——做主流的专家系统,还是走一条没人验证过的路?
二、突破:勇敢走不同的路
当时的背景
1980年代,语音识别领域的主流路线是专家系统:让人类专家定义规则,教机器如何识别语音。
但李开复通过朋友接触到了另一条路线:隐马尔可夫模型(HMM)——一种基于概率统计的机器学习方法。
导师的一句话,改变了一切
李开复去找导师Raj Reddy,说:“我尊敬您,但我想尝试一种不同的方法——用隐马尔可夫模型。”
Raj回答了一句非常了不起的话:“我不同意你,但我会支持你。”
这句话让李开复终身受益。他后来总结:
“AI的突破很少来自孤立的灵感。真正改变历史的,是有人敢走不同的路。”
成功的三要素
李开复拿到了做研究需要的三样关键资源:
- 海量数据:“没有任何数据能胜过更多的数据。”(IBM研究员Fred Jelinek的名言,李开复至今深信不疑)
- 强大算力:20台SPARCstation,在当时是惊人的算力
- 自由探索:导师的支持,让他可以追求自己真正有热情的方向
96%准确率的震撼
经过一系列改进(优化模型结构、采用更好的信号处理、引入语言模型),在一个周六早晨,李开复发现系统准确率达到了96%。
“技术突破往往不是单点奇迹,而是模型结构、数据表示、上下文建模、数据规模和计算资源等多个正确方向同时叠加后的结果。”
三、演进:AI技术的三次跃迁
第一次跃迁:从HMM到深度学习
李开复的博士论文让HMM成为语音识别的行业标配。但几年后,基于HMM的改进逐渐变慢。
“靠这套方法无法真正到达终点。”
下一次突破来自深度学习。当Geoffrey Hinton利用李飞飞的ImageNet数据库证明深度学习可以打破计算机视觉基准后,语音识别也迎来飞跃。
关键洞察:神经网络的想法一直存在,只是过去没有足够算力训练足够大的网络。当层数增加、数据规模扩大、算力增强后,性能就大幅提升。
第二次跃迁:从深度学习到Transformer
再往后,就是今天我们熟悉的Transformer和大语言模型。
核心进步:
- 过去:二元语法、三元语法(只能看前一两个词)
- 现在:Transformer可以关注上百万个词的上下文,并通过注意力机制进行选择性处理
不变的底层逻辑
回顾AI技术演进,李开复认为关键始终在于四件事:
| 要素 | 作用 | 例子 |
|---|---|---|
| 模型架构 | 定义如何处理信息 | HMM → 深度学习 → Transformer |
| 海量数据 | 让机器真正"理解" | “没有数据能胜过更多的数据” |
| 强大算力 | 训练更大规模的模型 | 20台SPARCstation → GPU集群 |
| 处理上下文的能力 | 理解复杂关系 | 看1-2个词 → 看100万个词 |
四、惊喜:过去5年最震撼的事
李开复说,最大的惊喜有三个:
1. Transformer架构竟然能带我们走得如此之远
他是GPT-2的早期测试者,当时就意识到Transformer会带来巨大提升,但**“没有料到它能像今天这样扩展得如此庞大、深入”**。
2. Scaling Law(缩放定律)竟然能持续奏效如此之久
模型越大、数据越多、算力越强,性能就越好——这个规律竟然一直成立。
3. 强化学习终于发挥了关键作用
经过多年蛰伏,强化学习在大语言模型时代终于展现出巨大价值。
一个有趣的观察:经验可能是负担
李开复坦承:
“我被过去那种长期缓慢发展的节奏给’毒害’了,所以我花了一段时间才适应这个快节奏。”
那些在生成式AI时代长大的20多岁的年轻人,思想完全是"未被约束"的。他们就像李开复当年很幸运地在机器学习领域未被更早期的"专家系统"约束一样。
“AI的历史不是一条直线,而是一代人不断推翻上一代人的确定性。”
五、未来:接下来会发生什么?
近期突破(3-4年内)
李开复预测:
- AI做出突破性的科学发现——不会让人惊讶
- 三四年内,AI领域就会出现诺贝尔奖级别的突破(真正被授予诺贝尔奖可能需要更长时间)
长远影响
一旦AI能加速科学发现,它带来的将不只是效率提升,也可能推动:
- 健康寿命延长
- 物质财富增加
- 更多人类难题的解决
六、给年轻研究者的建议
如果有即将入学的计算机科学与AI专业博士生问李开复该怎么做,他会给出这样的建议:
情况一:想参与当前的主流突破
寻找那些与拥有大量计算资源的企业有合作关系的教授。
原因:今天基于Transformer的生成式AI要继续发展,必须建立在庞大算力基础设施之上,而多数纯学术机构并不具备这样的条件。
情况二:寻找下一个范式
打破常规,寻找Transformer之外的下一个范式。
“当所有人都在优化答案时,总要有人重新定义问题。”
如果没有充足计算资源,很难在谷歌或OpenAI的主战场上击败他们。但你可以做他们还不知道怎么做的事——去构建或发明下一个Transformer,或者下一代强化学习机制。
关键洞察:
- AI领域真正稀缺的,从来不是共识,而是能被验证的非共识。
- 那些在谷歌崛起后仍固执己见做传统信息检索的人,最终走进了死胡同。
- 学术界的光明未来,必须脚踏实地。
七、结语:不变的本质
回到文章开头的问题:AI领域40多年,真正不变的是什么?
答案不是某个具体的技术、某个模型、某个算法,而是:
不变的四大底层变量
- 数据:从"没有任何数据能胜过更多的数据",到今天的大语言模型训练语料
- 算力:从20台SPARCstation,到今天的GPU集群和数据中心
- 模型架构:从HMM到深度学习到Transformer——形式在变,但"如何更好地处理信息"这个问题不变
- 真实问题:技术最终要解决的问题——让机器真正理解人类
不变的精神
- 敢于走不同的路:Raj的那句"我不同意你,但我会支持你"
- 用结果说话:技术路线之争,不是靠辩论赢的,是要靠结果赢的
- 一代人推翻一代人的确定性:AI的历史不是直线,而是不断颠覆的过程
文章来源:零一万物 01AI
责编:林洁
希望这篇文章能帮助你理解AI技术演进的背后逻辑,以及那些真正推动进步的不变量。技术的进步或许很快,但有些东西,始终未变。