news 2026/6/22 0:09:28

MCP 协议实战:让 AI 直接操作你的桌面应用,这不比 RPA 香?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MCP 协议实战:让 AI 直接操作你的桌面应用,这不比 RPA 香?

上个月我在搞一个自动化流程,想把 AI 生成的报表直接存到本地 Excel,然后发邮件。

折腾了半天 prompt,AI 只能给我一段 Python 代码,让我自己跑。我说你能不能直接帮我干了?它说不行,我没权限。

直到我发现了 MCP 协议。

说人话就是:MCP(Model Context Protocol)让 AI 模型能直接操作你电脑上的各种应用——读写文件、操作数据库、发邮件、控制浏览器。跟 RPA 有点像,但不是一个量级的东西。

先搞清楚:MCP 到底解决什么问题

用过 OpenAI 的 Function Calling 吗?你定义一堆函数,AI 决定调哪个。但问题是:

  • 每个工具都得你自己写接入代码
  • 换一个 AI 模型,代码全废
  • 数据在 AI 和工具之间传来传去,容易丢

MCP 的思路完全不同。它定义了一套标准协议,让 AI 客户端和工具服务端之间统一通信。

抽象点说,MCP 有三层:

AI 应用 (客户端) ↓ MCP 协议 (标准化的 JSON-RPC) MCP Server (你的工具/应用) ↓ 本地系统 (文件、数据库、浏览器、邮件...)

你只需要启动一个 MCP Server,任何兼容 MCP 的 AI 都能直接调用。一次接入,到处可用。

我实测的场景:让 AI 操控我的桌面

上周我搭了一个 MCP Server,连了三个工具:

1. 文件系统操作

装一个filesystemMCP Server,AI 就能直接读写你的文件。

npx @modelcontextprotocol/server-filesystem /path/to/my/project

然后跟 AI 说:“帮我把 data 目录下所有 CSV 合并成一个文件,转成 JSON 存到 output 目录。”

30 秒后,文件已经躺在那里了。

以前我得:写 Python 脚本 → 跑起来 → 检查结果。现在一句话搞定。

2. 数据库查询

连上 PostgreSQL 的 MCP Server:

npx @modelcontextprotocol/server-postgres postgresql://user:pass@localhost/db

直接跟 AI 说:“查一下上个月的用户增长趋势,按周汇总,输出成一个表格。”

AI 自己生成了 SQL,连上数据库执行,然后把结果返回给我。

划重点:我不需要写一行 SQL。

3. 浏览器控制

这个最骚。装了playwrightMCP Server 之后,AI 可以操作浏览器。

我对 AI 说:“打开 CSDN 编辑器,把我刚写的文章发布出去。”

它真的打开了浏览器,定位到编辑器,贴入内容,点击发布。

这已经不是在聊天了,这是在替我干活。

MCP 比 RPA 强在哪?

我做了个对比:

维度RPA(传统)MCP
配置成本高,需要拖拽流程低,装个 Server 就行
灵活性固定流程,改一下重配AI 动态决策,改 prompt 就行
容错能力中间断了一般要重来AI 能自己判断出错了重试
学习曲线要学 UiPath/影刀会 npm install 就行
维护成本流程变了要改 UI 选择器AI 自适应

说实话,RPA 搞过的都懂——录制流程一时爽,维护火葬场。界面改一个按钮位置,你的流程就废了。MCP 是语义级的,AI 理解的是"帮我登录"而不是"点击坐标 (120, 350)"。

我踩的一个坑:权限和安全

刚开始我把 MCP Server 的权限放得太宽了。AI 能读我整个 home 目录,能删文件。

然后我说了句"帮我把没用的临时文件清理一下"——好家伙,它差点把我.env文件给删了。

血泪教训:MCP Server 的权限一定要限制死

// 只允许读写特定目录 npx @modelcontextprotocol/server-filesystem /home/me/projects --read-only

生产环境还建议加上:

  • 操作确认(每次写操作前让用户点头)
  • 操作日志(AI 干了什么全记录下来)
  • 限流(一分钟最多操作多少次)

怎么上手 MCP?

步骤很简单:

1. 搞个 Claude Desktop 或者支持 MCP 的客户端

Claude Desktop 原生支持 MCP。或者用 VS Code 的 Continue 插件。

2. 写个配置文件

{"mcpServers":{"filesystem":{"command":"npx","args":["@modelcontextprotocol/server-filesystem","/home/me/data"]},"sqlite":{"command":"uvx","args":["mcp-server-sqlite","--db-path","/home/me/data/test.db"]}}}

3. 重启客户端,开搞

然后在聊天框里直接说需求就行了。

现在的 MCP 生态到什么程度了?

我数了一下,目前官方和社区已经有的 MCP Server:

  • 文件系统操作
  • SQLite / PostgreSQL / MySQL 数据库
  • GitHub 仓库管理
  • Slack / 飞书 消息发送
  • 邮件发送和读取
  • 浏览器自动化 (Playwright)
  • Figma 设计稿操作
  • 本地文件搜索

而且这个列表每周都在涨。

我的判断是:MCP 可能是 2026 年最值得关注的基础设施级协议之一。它让 AI 从"聊天工具"变成了"执行工具",这不是量变,是质变。

写在最后

折腾 MCP 的这几天,我最大的感受是:AI 的能力上限不在模型本身,而在它能连接多少工具。

一个只会聊天的 GPT-5.5 和一个能操作你电脑的 GPT-5.5,完全是两个物种。

如果你也在搞 AI 自动化,强烈建议试试 MCP。装一个 Server,说一句需求,看 AI 帮你干活的感觉,真的很爽。

下一篇我打算写怎么写一个自定义的 MCP Server,感兴趣的可以关注一下。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/22 0:07:53

企业级应用如何利用Taotoken实现稳定高效的多模型调度

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 企业级应用如何利用Taotoken实现稳定高效的多模型调度 在构建基于大模型的企业级应用时,开发团队常常面临几个核心挑战…

作者头像 李华
网站建设 2026/5/20 12:25:01

CANN/asc-devkit Tiling注册API

REGISTER_TILING_DEFAULT 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https:…

作者头像 李华
网站建设 2026/5/20 12:24:05

模型广场功能详解如何为你的应用场景挑选合适的大模型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 模型广场功能详解如何为你的应用场景挑选合适的大模型 当你需要为你的应用接入大模型能力时,面对市场上众多的模型提供…

作者头像 李华
网站建设 2026/5/20 12:23:11

在模型广场中根据任务需求与预算快速选择合适的大模型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在模型广场中根据任务需求与预算快速选择合适的大模型 面对众多大模型厂商和不断更新的模型版本,开发者常常面临一个核…

作者头像 李华