上个月我在搞一个自动化流程,想把 AI 生成的报表直接存到本地 Excel,然后发邮件。
折腾了半天 prompt,AI 只能给我一段 Python 代码,让我自己跑。我说你能不能直接帮我干了?它说不行,我没权限。
直到我发现了 MCP 协议。
说人话就是:MCP(Model Context Protocol)让 AI 模型能直接操作你电脑上的各种应用——读写文件、操作数据库、发邮件、控制浏览器。跟 RPA 有点像,但不是一个量级的东西。
先搞清楚:MCP 到底解决什么问题
用过 OpenAI 的 Function Calling 吗?你定义一堆函数,AI 决定调哪个。但问题是:
- 每个工具都得你自己写接入代码
- 换一个 AI 模型,代码全废
- 数据在 AI 和工具之间传来传去,容易丢
MCP 的思路完全不同。它定义了一套标准协议,让 AI 客户端和工具服务端之间统一通信。
抽象点说,MCP 有三层:
AI 应用 (客户端) ↓ MCP 协议 (标准化的 JSON-RPC) MCP Server (你的工具/应用) ↓ 本地系统 (文件、数据库、浏览器、邮件...)你只需要启动一个 MCP Server,任何兼容 MCP 的 AI 都能直接调用。一次接入,到处可用。
我实测的场景:让 AI 操控我的桌面
上周我搭了一个 MCP Server,连了三个工具:
1. 文件系统操作
装一个filesystemMCP Server,AI 就能直接读写你的文件。
npx @modelcontextprotocol/server-filesystem /path/to/my/project然后跟 AI 说:“帮我把 data 目录下所有 CSV 合并成一个文件,转成 JSON 存到 output 目录。”
30 秒后,文件已经躺在那里了。
以前我得:写 Python 脚本 → 跑起来 → 检查结果。现在一句话搞定。
2. 数据库查询
连上 PostgreSQL 的 MCP Server:
npx @modelcontextprotocol/server-postgres postgresql://user:pass@localhost/db直接跟 AI 说:“查一下上个月的用户增长趋势,按周汇总,输出成一个表格。”
AI 自己生成了 SQL,连上数据库执行,然后把结果返回给我。
划重点:我不需要写一行 SQL。
3. 浏览器控制
这个最骚。装了playwrightMCP Server 之后,AI 可以操作浏览器。
我对 AI 说:“打开 CSDN 编辑器,把我刚写的文章发布出去。”
它真的打开了浏览器,定位到编辑器,贴入内容,点击发布。
这已经不是在聊天了,这是在替我干活。
MCP 比 RPA 强在哪?
我做了个对比:
| 维度 | RPA(传统) | MCP |
|---|---|---|
| 配置成本 | 高,需要拖拽流程 | 低,装个 Server 就行 |
| 灵活性 | 固定流程,改一下重配 | AI 动态决策,改 prompt 就行 |
| 容错能力 | 中间断了一般要重来 | AI 能自己判断出错了重试 |
| 学习曲线 | 要学 UiPath/影刀 | 会 npm install 就行 |
| 维护成本 | 流程变了要改 UI 选择器 | AI 自适应 |
说实话,RPA 搞过的都懂——录制流程一时爽,维护火葬场。界面改一个按钮位置,你的流程就废了。MCP 是语义级的,AI 理解的是"帮我登录"而不是"点击坐标 (120, 350)"。
我踩的一个坑:权限和安全
刚开始我把 MCP Server 的权限放得太宽了。AI 能读我整个 home 目录,能删文件。
然后我说了句"帮我把没用的临时文件清理一下"——好家伙,它差点把我.env文件给删了。
血泪教训:MCP Server 的权限一定要限制死。
// 只允许读写特定目录 npx @modelcontextprotocol/server-filesystem /home/me/projects --read-only生产环境还建议加上:
- 操作确认(每次写操作前让用户点头)
- 操作日志(AI 干了什么全记录下来)
- 限流(一分钟最多操作多少次)
怎么上手 MCP?
步骤很简单:
1. 搞个 Claude Desktop 或者支持 MCP 的客户端
Claude Desktop 原生支持 MCP。或者用 VS Code 的 Continue 插件。
2. 写个配置文件
{"mcpServers":{"filesystem":{"command":"npx","args":["@modelcontextprotocol/server-filesystem","/home/me/data"]},"sqlite":{"command":"uvx","args":["mcp-server-sqlite","--db-path","/home/me/data/test.db"]}}}3. 重启客户端,开搞
然后在聊天框里直接说需求就行了。
现在的 MCP 生态到什么程度了?
我数了一下,目前官方和社区已经有的 MCP Server:
- 文件系统操作
- SQLite / PostgreSQL / MySQL 数据库
- GitHub 仓库管理
- Slack / 飞书 消息发送
- 邮件发送和读取
- 浏览器自动化 (Playwright)
- Figma 设计稿操作
- 本地文件搜索
而且这个列表每周都在涨。
我的判断是:MCP 可能是 2026 年最值得关注的基础设施级协议之一。它让 AI 从"聊天工具"变成了"执行工具",这不是量变,是质变。
写在最后
折腾 MCP 的这几天,我最大的感受是:AI 的能力上限不在模型本身,而在它能连接多少工具。
一个只会聊天的 GPT-5.5 和一个能操作你电脑的 GPT-5.5,完全是两个物种。
如果你也在搞 AI 自动化,强烈建议试试 MCP。装一个 Server,说一句需求,看 AI 帮你干活的感觉,真的很爽。
下一篇我打算写怎么写一个自定义的 MCP Server,感兴趣的可以关注一下。