news 2026/6/10 22:39:08

AI领域40多年,真正不变的是什么?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI领域40多年,真正不变的是什么?

AI领域40多年,真正不变的是什么?

零一万物CEO李开复与AI老兵Tom Mitchell的深度对谈

从隐马尔可夫模型到Transformer,从语音识别到大语言模型,技术范式一直在变。但推动AI进步的本质,从未改变。


一、起点:一个改变一生的选择

1979年,年轻的李开复进入哥伦比亚大学,对人工智能产生了浓厚兴趣。

“AI是人类认识并理解自己的最后一里路。”

他认为,探索大脑工作机制,就是在回答一个更重大的问题:我们能否创造出比肩人类的智能体?

带着这个梦想,李开复来到卡内基梅隆大学(CMU)攻读博士。在这里,他遇到了一个关键选择——做主流的专家系统,还是走一条没人验证过的路?


二、突破:勇敢走不同的路

当时的背景

1980年代,语音识别领域的主流路线是专家系统:让人类专家定义规则,教机器如何识别语音。

但李开复通过朋友接触到了另一条路线:隐马尔可夫模型(HMM)——一种基于概率统计的机器学习方法。

导师的一句话,改变了一切

李开复去找导师Raj Reddy,说:“我尊敬您,但我想尝试一种不同的方法——用隐马尔可夫模型。”

Raj回答了一句非常了不起的话:“我不同意你,但我会支持你。”

这句话让李开复终身受益。他后来总结:

“AI的突破很少来自孤立的灵感。真正改变历史的,是有人敢走不同的路。”

成功的三要素

李开复拿到了做研究需要的三样关键资源:

  1. 海量数据:“没有任何数据能胜过更多的数据。”(IBM研究员Fred Jelinek的名言,李开复至今深信不疑)
  2. 强大算力:20台SPARCstation,在当时是惊人的算力
  3. 自由探索:导师的支持,让他可以追求自己真正有热情的方向

96%准确率的震撼

经过一系列改进(优化模型结构、采用更好的信号处理、引入语言模型),在一个周六早晨,李开复发现系统准确率达到了96%

“技术突破往往不是单点奇迹,而是模型结构、数据表示、上下文建模、数据规模和计算资源等多个正确方向同时叠加后的结果。”


三、演进:AI技术的三次跃迁

第一次跃迁:从HMM到深度学习

李开复的博士论文让HMM成为语音识别的行业标配。但几年后,基于HMM的改进逐渐变慢。

“靠这套方法无法真正到达终点。”

下一次突破来自深度学习。当Geoffrey Hinton利用李飞飞的ImageNet数据库证明深度学习可以打破计算机视觉基准后,语音识别也迎来飞跃。

关键洞察:神经网络的想法一直存在,只是过去没有足够算力训练足够大的网络。当层数增加、数据规模扩大、算力增强后,性能就大幅提升。

第二次跃迁:从深度学习到Transformer

再往后,就是今天我们熟悉的Transformer和大语言模型

核心进步

  • 过去:二元语法、三元语法(只能看前一两个词)
  • 现在:Transformer可以关注上百万个词的上下文,并通过注意力机制进行选择性处理

不变的底层逻辑

回顾AI技术演进,李开复认为关键始终在于四件事:

要素作用例子
模型架构定义如何处理信息HMM → 深度学习 → Transformer
海量数据让机器真正"理解"“没有数据能胜过更多的数据”
强大算力训练更大规模的模型20台SPARCstation → GPU集群
处理上下文的能力理解复杂关系看1-2个词 → 看100万个词

四、惊喜:过去5年最震撼的事

李开复说,最大的惊喜有三个:

1. Transformer架构竟然能带我们走得如此之远

他是GPT-2的早期测试者,当时就意识到Transformer会带来巨大提升,但**“没有料到它能像今天这样扩展得如此庞大、深入”**。

2. Scaling Law(缩放定律)竟然能持续奏效如此之久

模型越大、数据越多、算力越强,性能就越好——这个规律竟然一直成立。

3. 强化学习终于发挥了关键作用

经过多年蛰伏,强化学习在大语言模型时代终于展现出巨大价值。

一个有趣的观察:经验可能是负担

李开复坦承:

“我被过去那种长期缓慢发展的节奏给’毒害’了,所以我花了一段时间才适应这个快节奏。”

那些在生成式AI时代长大的20多岁的年轻人,思想完全是"未被约束"的。他们就像李开复当年很幸运地在机器学习领域未被更早期的"专家系统"约束一样。

“AI的历史不是一条直线,而是一代人不断推翻上一代人的确定性。”


五、未来:接下来会发生什么?

近期突破(3-4年内)

李开复预测:

  • AI做出突破性的科学发现——不会让人惊讶
  • 三四年内,AI领域就会出现诺贝尔奖级别的突破(真正被授予诺贝尔奖可能需要更长时间)

长远影响

一旦AI能加速科学发现,它带来的将不只是效率提升,也可能推动:

  • 健康寿命延长
  • 物质财富增加
  • 更多人类难题的解决

六、给年轻研究者的建议

如果有即将入学的计算机科学与AI专业博士生问李开复该怎么做,他会给出这样的建议:

情况一:想参与当前的主流突破

寻找那些与拥有大量计算资源的企业有合作关系的教授。

原因:今天基于Transformer的生成式AI要继续发展,必须建立在庞大算力基础设施之上,而多数纯学术机构并不具备这样的条件。

情况二:寻找下一个范式

打破常规,寻找Transformer之外的下一个范式。

“当所有人都在优化答案时,总要有人重新定义问题。”

如果没有充足计算资源,很难在谷歌或OpenAI的主战场上击败他们。但你可以做他们还不知道怎么做的事——去构建或发明下一个Transformer,或者下一代强化学习机制。

关键洞察

  • AI领域真正稀缺的,从来不是共识,而是能被验证的非共识。
  • 那些在谷歌崛起后仍固执己见做传统信息检索的人,最终走进了死胡同。
  • 学术界的光明未来,必须脚踏实地。

七、结语:不变的本质

回到文章开头的问题:AI领域40多年,真正不变的是什么?

答案不是某个具体的技术、某个模型、某个算法,而是:

不变的四大底层变量

  1. 数据:从"没有任何数据能胜过更多的数据",到今天的大语言模型训练语料
  2. 算力:从20台SPARCstation,到今天的GPU集群和数据中心
  3. 模型架构:从HMM到深度学习到Transformer——形式在变,但"如何更好地处理信息"这个问题不变
  4. 真实问题:技术最终要解决的问题——让机器真正理解人类

不变的精神

  • 敢于走不同的路:Raj的那句"我不同意你,但我会支持你"
  • 用结果说话:技术路线之争,不是靠辩论赢的,是要靠结果赢的
  • 一代人推翻一代人的确定性:AI的历史不是直线,而是不断颠覆的过程

文章来源:零一万物 01AI
责编:林洁


希望这篇文章能帮助你理解AI技术演进的背后逻辑,以及那些真正推动进步的不变量。技术的进步或许很快,但有些东西,始终未变。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 22:38:17

2型糖尿病强化治疗:CagriSema加用基础胰岛素的REIMAGINE 3研究

基础胰岛素是 2 型糖尿病治疗中的重要阶梯,但临床上常见一个两难局面:胰岛素剂量越往上调,低血糖和体重增加的顾虑越突出;剂量不够,又难以把血糖长期控制到理想范围。2026 年发表在 *The Lancet* 的 REIMAGINE 3 研究&…

作者头像 李华
网站建设 2026/6/10 22:36:24

你的AI正在烧掉90%的Token:一场隐性的AI成本危机已经到来

你的AI正在烧掉90%的Token:一场隐性的AI成本危机已经到来Netflix 高级工程师开源的 Headroom 工具,宣称能帮 AI 应用砍掉 90% 的 Token 消耗、一年省下 70 万美元。这不只是一次"开源好人好事",更是一个信号:AI 成本失控…

作者头像 李华
网站建设 2026/6/10 22:29:21

模板跟string的实现

全局变量和静态变量(无论全局还是函数内),生命周期贯穿整个程序运行期,都存放在数据段(静态区)。区别仅在于作用域:static 限制了作用域,不影响内存分区。localVar / num1 / char2函…

作者头像 李华