2026年6月10日,约翰·斯科特 - 雷尔顿发布推文称,恶意软件开发者在间谍软件中添加了核武器和生物武器相关文本。其目的是触发大语言模型(LLM)的安全拒绝机制,从而使间谍软件不会被人工智能安全扫描器分析。这条推文获得了150万浏览量。
这一事件典型地说明了当封闭(和开放)模型采用激进的拒绝策略时,过度关注一级安全会带来问题。因为这会产生二级盲点,攻击者会发现并利用这些盲点。目前攻击者利用这些特性还处于早期阶段。
@SocketSecurity的文章表明,在设计恶意软件分析流程以避免提示操纵时,意图是非常重要的。这提醒安全行业在应对此类威胁时,要更加全面地考虑恶意软件的设计意图。
编辑观点:安全策略不能只注重表面,过度的安全限制可能会带来新的安全漏洞。行业需在保障安全的同时,更深入地分析攻击者的意图和手段。