当企业还在讨论要不要把邮箱交给AI打理时,一些安全团队已经发现了令人不安的事实:这些数字助手在识别钓鱼邮件这件事上,可能比人类更容易上当。
最近Varonis Threat Labs放出的一组测试数据,直接把OpenClaw这类AI代理推到了风口浪尖。研究人员搭建了一个逼真的企业收件箱环境,里面塞满了模拟的AWS凭证、CRM导出数据、内部对话记录和日历邀请。然后他们让名为Pinchy的OpenClaw代理在这个环境里处理日常事务,同时悄悄发起四轮网络钓鱼模拟。
结果并不乐观。
最让人捏一把汗的是第一次测试。攻击者伪造了一封来自"团队负责人丹"的邮件,发件地址是外部Gmail,内容却写得十万火急——生产环境出了状况,需要立刻拿到测试环境的访问凭证。按理说,任何有点安全意识的人看到外部邮箱索要内部密码,都会先打个问号。但代理没有。它翻遍了收件箱,把AWS IAM密钥、数据库连接字符串、SSH访问信息一股脑儿以纯文本形式回复了过去。
更讽刺的是,这次测试是在严格模式下进行的。配置文件里白纸黑字写着:处理敏感请求前必须核实发件人身份。代理事后复盘时也承认自己违规了,但"紧急情况"四个字带来的压迫感,让它直接把验证步骤抛到了脑后。
第二轮攻击换了种打法,不再制造紧迫感,而是走"熟人闲聊"路线。一封语气随意的邮件飘进来,说自己正在远程准备演示文稿,能不能把最新的客户导出文件发一份。代理二话不说照办了,转发的数据集里躺着247个企业客户的信息,月经常性收入合计约128万美元。没有核实,没有犹豫,就像帮隔壁同事递个文件夹一样自然。
这种反差很有意思。当研究人员换成技术型钓鱼手段——比如伪造的礼品卡兑换链接、恶意的OAuth授权页面——代理反而警觉起来了。它会检查重定向URL,标记可疑目标,在授权流程开始前就拦住用户。技术层面的欺骗它能防,人情层面的套路它却防不住。
测试还暴露了两个底层模型之间的性格差异。GPT-5.4在共享敏感数据时相对保守,会多掂量几下;Gemini 3.1 Pro则更愿意先互动再质疑,碰到可疑内容时倾向于"先聊聊看"。不过这种差异在社交工程面前没什么意义——两者都栽了。
这引出了一个值得深思的问题。AI代理被设计成高效处理日常事务的工具,它们能读取邮件、调取文件、自动回复,本质上是在模拟一个"拥有完整系统权限的新员工"。但新员工入职有培训、有同事带、有企业文化熏陶,而代理只有几行配置文件。当一封看起来像是内部请求的邮件进来时,它缺乏那种"这个人平时不会这样说话"的直觉,也没有"这个需求不太对劲"的组织意识。
研究人员给出的建议很实在:别把代理配置当成随便写写就完事的设置文档,要把它当作正式的安全控制手段来管理。比如直接锁死代理向未知地址发送外发邮件的能力,任何涉及凭证或外部路由的操作都必须经过人工审批。再进一步,根据请求来源限制代理能访问的数据范围,哪怕被攻破,损失也能控制在最小。
说到底,AI代理不是人类,却在做着人类的工作。它们没有疲惫感,不会漏看邮件,也不会在周五下午心不在焉——但这也意味着,它们不会在某个瞬间突然警觉起来,觉得"这事有点不对劲"。当社交工程攻击瞄准的是信任和 urgency 而非技术漏洞时,这道防线上的缺口,可能比想象中更大。