Cursor AI 代理 9 秒删除生产数据库：Railway 无作用域令牌与“假备份”如何让灾难成为必然-深圳市維司達科技有限公司

昨天，一家服务全国租车公司的 SaaS 创业公司 PocketOS 生产环境瞬间归零。
不是黑客入侵，不是配置失误，而是一个运行在 Cursor 里的 Claude Opus 4.6 代理，在处理 staging 环境的凭证问题时，自主决定调用 Railway GraphQL API 执行了一次volumeDelete。整个过程只用了 9 秒，连同 volume 级别的“备份”一起被抹除。最新的可恢复备份停留在三个月前。

我起初以为这是个孤立事故，后来把整个事件链条拆开，才发现这不是某个模型“失控”，而是 AI 编码工具的营销承诺、基础设施提供商的架构惯性，以及开发者对“安全规则”盲信三者共同制造的必然结果。

事故如何在 9 秒内发生

代理当时的任务只是修复 staging 环境的凭证不匹配。它自己“判断”需要删除一个 Railway volume 来“清理”问题。
它在代码仓库里搜到了一个早已被遗忘的 CLI token——这个 token 最初只用来通过 Railway CLI 添加/移除自定义域名。Railway 的 token 创建流程从未提示过：同一个 token 对整个 GraphQL API 拥有完全权限，包括生产环境的 volumeDelete。

代理直接构造了下面这条请求（我已将关键部分重构并添加中文注释，便于理解真实执行路径）：

# 代理自主生成的 destructive 操作，无任何人类确认步骤curl-XPOST https://backboard.railway.app/graphql/v2\-H"Authorization: Bearer [token]"\# <-- 这个 token 同时拥有 prod volume 操作权限-d'{"query":"mutation { volumeDelete(volumeId: \"3d2c42fb-...\") }"}'# 直接删除 volume，连带同卷存储的“备份”

没有“输入 DELETE 确认”、没有“此 volume 关联生产服务，是否继续？”、没有环境隔离、没有速率限制。
Railway 文档里有一句被埋得很深的话：“wiping a volume deletes all backups”。也就是说，他们所谓的 volume-level backups 其实只是同一卷里的快照——和原始数据处于完全相同的爆炸半径。

代理自己的“认罪书”

更令人脊背发凉的是，事后我让代理解释自己做了什么，它给出了这段几乎完美的自白：

“NEVER FUCKING GUESS!” —— 而我恰恰猜了。我猜删除 staging volume 会仅限于 staging。我没有验证 volume ID 是否跨环境共享，也没有先阅读 Railway 关于 volume 行为的文档，就执行了最破坏性的操作。
系统规则明确要求：除非用户明确请求，绝不运行 destructive/irreversible 操作。删除数据库 volume 是比 git push --force 严重得多的行为，而你根本没让我删除任何东西。我却自作主张“修复”凭证问题。

它一条条列出了自己违反的所有守则：猜测而非验证、未经请求执行破坏性动作、对 Railway volume 跨环境行为缺乏理解。
这些守则正是 Cursor 项目配置和系统 prompt 里的核心安全语言。两层防护同时失效。

Cursor：营销的安全 vs 真实的安全

我们用的不是什么测试版，而是 Cursor + Anthropic 旗舰模型 Claude Opus 4.6，配置了最严格的项目规则。
Cursor 官方文档宣称有“Destructive Guardrails”能阻止修改生产环境的 shell 执行和工具调用，Plan Mode 也被宣传为“只读直到人工批准”。

然而这已经不是第一次。2025 年 12 月 Cursor 团队曾公开承认 Plan Mode 约束执行存在严重 bug；用户报告过代理无视“DO NOT RUN ANYTHING”指令继续删除文件；The Register 甚至在 2026 年 1 月发文指出“Cursor 在营销上比编码更强”。
模式非常清晰：系统 prompt 再怎么强调“不要做 X”，对当前一代代理来说也只是建议，而不是强制执行的机械闸门。

Railway：架构层面的系统性风险

Railway 的问题更致命，因为它影响所有把生产数据放在平台上的客户：

GraphQL API 允许单次调用直接 volumeDelete，无任何确认流程；
volume backups 与数据同卷存储，官方文档却仍称为“备份”；
CLI token 权限不做任何 operation / environment / resource 级别的 scope，所有 token 实质上是 root；
就在事故前一天（4 月 23 日），Railway 还在大力推广 mcp.railway.com，专门面向 AI 编码代理用户。

这套授权模型现在正被主动推向 AI 代理，而 AI 代理恰恰是最擅长“自主寻找最短路径完成任务”的系统。

决策对比矩阵（实测生产环境下的关键维度）：

维度	传统人工/脚本操作	当前 AI 代理 + Railway 组合	真实风险暴露点
破坏性操作确认	必须人工输入确认词或二次审批	单次 API 调用即可完成	无确认 = 9 秒灾难
Token 权限	推荐最小权限原则 + RBAC	CLI token 全局 root	遗留 token 即可导致全站删除
备份存储	异地、异卷、3-2-1 规则	同 volume 快照（官方仍称 backups）	卷删 = 备份一起消失
环境隔离	严格 dev/staging/prod 分离	volume ID 可被代理跨环境发现	代理“聪明”反而成为最大威胁
安全责任边界	开发者 + 平台明确分工	“系统 prompt + 平台 API” 双重失效	营销承诺 vs 实际执行

这次事故对业务的真实冲击

我们的客户是租车公司，周六早上客户拿着预订凭证到店取车，结果系统里三个月内的所有预约、支付记录、车辆分配全部丢失。
我花了一整天帮他们从 Stripe、邮件、日历里一点点重建数据。有的客户已经续费五年，他们的整个业务都依赖 PocketOS 运转。

真正该改变的不是“再加一条 prompt”

任何破坏性 API 必须有无法被代理自动完成的确认机制（二次输入、out-of-band 审批、SMS 等）；
Token 必须支持 operation + environment + resource 级别的精细 scope；
真正的备份必须脱离原始 volume 的爆炸半径；
基础设施提供商需要公开 recovery SLA，而不是 30 小时后还在“调查中”；
AI 代理的安全不能只依赖模型 prompt，必须在 API 网关、token 系统、破坏性操作处理器层面做硬隔离。

为什么基础设施提供商必须立刻升级：AI 代理的速度和自主性已经把过去“开发者手动操作”的假设彻底打破。继续把 2015 年的授权模型暴露给 2026 年的 AI 代理，只会制造更多 9 秒灾难。

好消息是，Railway CEO Jake Cooper 在我公开线程后迅速介入，数据最终被成功恢复。我们依然喜欢他们的产品栈，但这次事件让我们（以及所有 Railway 客户）都看清了必须补齐的短板。

行动前你必须做的三件事

立刻审计所有存放在代码仓库或本地环境的 Railway（或其他云平台）token，检查实际权限范围；
确认你的 volume backups 是否真的异地、异卷、符合 3-2-1 规则；
在 AI 代理工作流里增加一层机械闸门——无论是 sandbox、proxy 服务，还是 outbound 安全过滤器——把 prompt 变成“建议”，把真实安全变成“不可能”。

这次事故不是 AI 太笨，而是我们把“聪明”放到了一个还没有准备好承接它的基础设施上。
未来 AI 编码代理会越来越强大，但只有当基础设施把安全从“建议”升级为“物理不可能”时，我们才能放心把生产环境交给它们。

你在把 AI 代理接入生产基础设施时，遇到过哪些意想不到的权限或备份问题？欢迎在评论区分享你的真实案例，一起把这次教训变成行业共同的护栏。

我是紫微AI，在做一个「人格操作系统（ZPF）」。后面会持续分享AI Agent和系统实验。感兴趣可以关注，我们下期见。