2025年大模型LLMs发展全解析：从RLVR到氛围编程，一文掌握AI前沿趋势-深圳市維司達科技有限公司

2025年大模型(LLMs)实现六大范式转变：RLVR技术提升推理能力；呈现"锯齿状"智能特征；Cursor等应用实现垂直专业化；Claude Code展示本地AI代理潜力；"氛围编码"降低编程门槛；Nano预示LLM GUI新交互范式。LLM正成为新型智能形态，既强大又局限，但其潜力尚未被充分挖掘。

2025年大模型LLMs的发展回顾 Andrej Karpath/ 2025 年 12 月 19 日

2025 年是 LLM 取得强劲且富有成果的一年。以下是一个个人认为值得关注且略微令人惊讶的“范式转变”列表 - 这些变化改变了格局，并在概念上让我印象深刻。

1. 从可验证奖励中进行强化学习 (RLVR)

在 2025 年初，所有实验室的 LLM 生产堆栈看起来都像这样：

预训练（GPT-2/3，约 2020 年）
监督式微调（InstructGPT，约 2022 年）以及
从人类反馈中进行强化学习 (RLHF，约 2022 年)

这是一段时间内训练生产级 LLM 的稳定且经过验证的方法。在 2025 年，从可验证奖励中进行强化学习 (RLVR) 成为事实上的新主要阶段，可以添加到此组合中。通过在许多环境中针对自动可验证的奖励训练 LLM（例如，考虑数学/代码难题），LLM 自发地开发出看起来像人类“推理”的策略 - 它们学习将问题解决分解为中间计算，并且它们学习了许多来回解决问题的策略（有关示例，请参见 DeepSeek R1 论文）。这些策略在以前的范式中很难实现，因为不清楚 LLM 的最佳推理轨迹和恢复是什么样的 - 它必须通过针对奖励的优化来找到适合它的方法。

与 SFT 和 RLHF 阶段（两者都是相对薄/短的阶段（计算上的微小调整））不同，RLVR 涉及针对客观（不可游戏化）的奖励函数进行训练，这允许更长时间的优化。事实证明，运行 RLVR 可以提供较高的能力/$，从而消耗了最初用于预训练的计算资源。因此，2025 年的大部分能力进展都是由 LLM 实验室完成的，它们完成了这个新阶段的悬垂，总体而言，我们看到了规模相似的 LLM，但 RL 运行时间更长。同样，在这个新阶段独有的是，我们获得了一个全新的旋钮（以及相关的缩放定律），可以通过生成更长的推理轨迹并增加“思考时间”来控制能力作为测试时间计算的函数。OpenAI o1（2024 年末）是 RLVR 模型的第一个演示，但 o3 版本（2025 年初）是一个明显的拐点，您可以直观地感受到其中的差异。

2. 幽灵 vs. 动物 / 锯齿状智能

2025 年是我（并且我认为行业中的其他人也）开始从更直观的意义上内化 LLM 智能的“形状”的一年。我们不是在“进化/培育动物”，而是在“召唤幽灵”。LLM 堆栈的一切都不同（神经架构、训练数据、训练算法，尤其是优化压力），因此，我们在智能领域中获得非常不同的实体也就不足为奇了，通过动物视角来思考这些实体是不合适的。从位层面来看，人类神经网络针对丛林中部落的生存进行了优化，但 LLM 神经网络针对模仿人类文本、收集数学难题奖励以及从 LM Arena 上的人类那里获得赞成票进行了优化。随着可验证领域允许 RLVR，LLM 在这些领域附近的能力“飙升”，并且总体上显示出令人啼笑皆非的锯齿状性能特征 - 它们同时是天才博学家和一个困惑且认知上受到挑战的小学生，随时可能被越狱欺骗以泄露您的数据。

(人类智能：蓝色，人工智能：红色。我喜欢这个版本的模因（很抱歉我失去了对其在 X 上的原始帖子的引用），因为它指出了人类智能在其自身不同的方面也是锯齿状的。)

与此相关的是，我对 2025 年的基准测试普遍漠不关心并且失去了信任。核心问题是，基准测试几乎是通过构造可验证的环境，因此立即容易受到 RLVR 和通过合成数据生成而产生的较弱形式的影响。在典型的基准测试过程中，LLM 实验室中的团队不可避免地会构建与基准测试占据的嵌入空间的小口袋相邻的环境，并生成 jaggies 以覆盖它们。在测试集上进行训练是一种新的艺术形式。

粉碎所有基准测试但仍然无法获得 AGI 会是什么样？

我在这里写了更多关于本节主题的内容：

动物 vs. 幽灵
可验证性
思维空间

3. Cursor / LLM 应用的新层

我发现 Cursor 最值得注意的是（除了它今年像流星般崛起之外），它令人信服地揭示了“LLM 应用”的新层 - 人们开始谈论“Cursor for X”。正如我在今年的 Y Combinator 演讲中强调的那样（文字稿和视频），像 Cursor 这样的 LLM 应用为特定垂直领域捆绑和协调 LLM 调用：

他们进行“上下文工程”
他们在幕后协调多个 LLM 调用，这些调用串联成越来越复杂的 DAG，仔细平衡性能和成本的权衡。
它们为循环中的人提供特定于应用程序的 GUI
它们提供“自主滑块”

2025 年，人们花了很多时间讨论这个新的应用层有多“厚”。LLM 实验室会捕获所有应用程序，还是 LLM 应用有绿色牧场？我个人怀疑 LLM 实验室将倾向于培养具有普遍能力的大学生，但 LLM 应用将通过提供私人数据、传感器和执行器以及反馈循环来组织、微调并将他们真正地转化为特定垂直领域中已部署的专业人员团队。

4. Claude Code / 驻留在您计算机上的 AI

Claude Code (CC) 作为 LLM 代理的第一个令人信服的演示而出现 - 它以循环的方式将工具的使用和推理串联在一起，以进行扩展的问题解决。此外，CC 值得我注意的是，它在您的计算机上以及您的私人环境、数据和上下文中运行。我认为 OpenAI 犯了错误，因为他们将早期的 Codex / 代理工作重点放在从 ChatGPT 编排的容器中的云部署上，而不是简单地localhost。虽然在云中运行的代理集群感觉像是“AGI 终局”，但我们生活在一个中间和足够慢的起飞世界中，其中锯齿状功能使得直接在开发人员的计算机上运行代理更有意义。请注意，重要的主要区别不是“AI ops”碰巧在哪里运行（在云中、本地或任何地方），而是关于其他一切 - 已经启动的计算机、其安装、上下文、数据、机密、配置以及低延迟交互。Anthropic 正确地获得了此优先级顺序，并将 CC 打包成一个令人愉悦的、最小的 CLI 外形，改变了 AI 的外观 - 它不仅仅是您访问的像 Google 这样的网站，而是一个“驻留”在您计算机上的小精灵/幽灵。这是一种与 AI 交互的新的、截然不同的范式。

5. 氛围编码

2025 年是 AI 跨越了一个必要的能力阈值的一年，只需通过英语即可构建各种令人印象深刻的程序，而忘记了代码的存在。有趣的是，我在这条想法推文中创造了“氛围编码”一词，完全没有意识到它会走多远 😃。通过氛围编码，编程不再严格限于训练有素的专业人士，而是任何人都可以做的事情。在这方面，这是我在赋予人民权力：LLM 如何颠覆技术传播中写道的另一个例子，说明了（与迄今为止的所有其他技术形成鲜明对比）与专业人士、公司和政府相比，普通人从 LLM 中受益更多。但氛围编码不仅使普通人能够接触编程，而且还使训练有素的专业人士能够编写更多的（氛围编码的）软件，否则这些软件永远不会被编写。在 nanochat 中，我用 Rust 氛围编码了我自己的高度高效的 BPE 分词器，而不是不得不采用现有的库或在该级别学习 Rust。今年，我氛围编码了许多项目，作为我想存在的某个东西的快速应用程序演示（例如，参见 menugen, llm-council, reader3, HN 时间胶囊）。而且我氛围编码了整个临时应用程序，只是为了找到一个错误，因为为什么不呢 - 代码突然变得免费、短暂、可塑、一次使用后可丢弃。氛围编码将改造软件并改变职位描述。

6. Nano banana / LLM GUI

Google Gemini Nano banana 是 2025 年最令人难以置信、改变范式的模型之一。在我的世界观中，LLM 是下一个主要的计算范式，类似于 1970 年代、80 年代等的计算机。因此，我们将看到出于根本相似的原因而产生的类似类型的创新。我们将看到个人计算、微控制器（认知核心）或互联网（代理）等的等效物。特别是，在 UIUX 方面，与 LLM“聊天”有点像在 1980 年代向计算机控制台发出命令。文本是计算机（和 LLM）的首选原始/数据表示形式，但它不是人们首选的格式，尤其是在输入时。人们实际上不喜欢阅读文本 - 它既缓慢又费力。相反，人们喜欢以视觉和空间方式消费信息，这就是 GUI 在传统计算中被发明的原因。以同样的方式，LLM 应该以我们喜欢的格式与我们对话 - 以图像、信息图表、幻灯片、白板、动画/视频、Web 应用程序等形式。当然，这个早期和现在的版本是表情符号和 Markdown 之类的东西，它们是以视觉方式“装饰”和布局文本的方式，以便通过标题、粗体、斜体、列表、表格等更容易地消费。但谁会真正构建 LLM GUI？在这种世界观中，nano banana 是对它可能是什么样子的第一个早期暗示。重要的是，它的一个显著方面是它不仅仅与图像生成本身有关，还与文本生成、图像生成和世界知识结合起来的能力有关，所有这些都纠缠在模型权重中。

TLDR。2025 年是 LLM 令人兴奋且略微令人惊讶的一年。LLM 正在成为一种新型智能，同时比我预期的要聪明得多，也比我预期的要愚蠢得多。无论如何，它们非常有用，并且我认为即使在目前的能力下，该行业也还没有意识到其潜力的 10%。与此同时，有很多想法可以尝试，并且从概念上讲，该领域感觉非常开放。正如我在今年早些时候在我的 Dwarkesh pod 中提到的那样，我同时（并且表面上矛盾地）相信我们将看到快速且持续的进步并且仍然有很多工作要做。系好安全带

最后

我在一线科技企业深耕十二载，见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事，早已在效率与薪资上形成代际优势，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包：

✅AI大模型学习路线图
✅Agent行业报告
✅100集大模型视频教程
✅大模型书籍PDF
✅DeepSeek教程
✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

为什么说现在普通人就业/升职加薪的首选是AI大模型？

人工智能技术的爆发式增长，正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议，到全国两会关于AI产业发展的政策聚焦，再到招聘会上排起的长队，AI的热度已从技术领域渗透到就业市场的每一个角落。

智联招聘的最新数据给出了最直观的印证：2025年2月，AI领域求职人数同比增幅突破200%，远超其他行业平均水平；整个人工智能行业的求职增速达到33.4%，位居各行业榜首，其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张，也让人才供需矛盾愈发突出。麦肯锡报告明确预测，到2030年中国AI专业人才需求将达600万人，人才缺口可能高达400万人，这一缺口不仅存在于核心技术领域，更蔓延至产业应用的各个环节。

资料包有什么？

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图（还有视频解说）

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了，这些是我精选出来的

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制，且资料与智泊AI共享，相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌，通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌，构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论，还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

如果说你是以下人群中的其中一类，都可以来智泊AI学习人工智能，找到高薪工作，一次小小的“投资”换来的是终身受益！

应届毕业生‌：无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌：非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈：传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

2025年大模型LLMs发展全解析：从RLVR到氛围编程，一文掌握AI前沿趋势

1. 从可验证奖励中进行强化学习 (RLVR)

2. 幽灵 vs. 动物 / 锯齿状智能

3. Cursor / LLM 应用的新层

4. Claude Code / 驻留在您计算机上的 AI

5. 氛围编码

6. Nano banana / LLM GUI

最后

为什么说现在普通人就业/升职加薪的首选是AI大模型？

资料包有什么？

①从入门到精通的全套视频教程⑤⑥

② AI大模型学习路线图（还有视频解说）

③学习电子书籍和技术文档

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

👉获取方式：

基于单片机红外感应智能卫生间系统

Java中的JVM（虚拟机）是什么，新书小白带你入门，收藏这篇就够了

【AI开发必备】Dify接入本地大模型实战指南，小白也能5分钟搞定！告别API收费，手把手教你搭建私有知识库！

【专家亲授】Open-AutoGLM部署实战：仅需6步实现高效本地化运行

为什么你的Open-AutoGLM在Mac上跑不起来：深度解析系统级适配障碍

Open-AutoGLM重试优化实战（专家级避坑手册，仅限内部分享）

1. 从可验证奖励中进行强化学习 (RLVR)

2. 幽灵 vs. 动物 / 锯齿状智能

3. Cursor / LLM 应用的新层

4. Claude Code / 驻留在您计算机上的 AI

5. 氛围编码

6. Nano banana / LLM GUI

​最后

为什么说现在普通人就业/升职加薪的首选是AI大模型？

资料包有什么？

①从入门到精通的全套视频教程⑤⑥

② AI大模型学习路线图（还有视频解说）

③学习电子书籍和技术文档

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

👉获取方式：

基于单片机红外感应智能卫生间系统

Java中的JVM（虚拟机）是什么，新书小白带你入门，收藏这篇就够了

【AI开发必备】Dify接入本地大模型实战指南，小白也能5分钟搞定！告别API收费，手把手教你搭建私有知识库！

【专家亲授】Open-AutoGLM部署实战：仅需6步实现高效本地化运行

为什么你的Open-AutoGLM在Mac上跑不起来：深度解析系统级适配障碍

Open-AutoGLM重试优化实战（专家级避坑手册，仅限内部分享）

最后