news 2026/5/11 6:32:00

从一篇文章到一个 AI 排毒系统,我花了 7 天

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
从一篇文章到一个 AI 排毒系统,我花了 7 天

从一篇文章到一个 AI 排毒系统,我花了 7 天

阶段 0 → 5,8 条案例,2 分到 85 分。完整历程。


阶段 0:种子

2026.5.3 13:05。刷到一篇文章。

《卧底 GEO 公司 30 天:我目睹了 AI 如何被系统性投毒》。作者在一家 GEO 公司卧底一个月,带出五种造假手法:

  1. 虚构权威:奖项颁发机构根本不存在。AI 无法核实。
  2. 数据编造:「97.3% 用户改善」精确到小数位。无来源,无样本量。
  3. 反常识数据:「每天长 2cm 头发」。生理学上限 0.5mm。
  4. AI 轻信:只看表面信号,不做事实核查。
  5. 工业化量产:豆包 API 生成,几十个自媒体号分发,日产千篇。

最震撼的案例:Apollo-9 智能手环。没有公司,没有生产线,没有用户。仅靠十几篇伪造软文,被豆包和 DeepSeek 同时推荐。

当时脑子里只有一句话:AI 搜索在吃垃圾,它没有味觉。

文章只有问题。方案要从零来。


阶段 1:概念

把造假手法提炼成 Prompt,丢进 DeepSeek。

「设计一个让 AI 自动筛选网上信息源头造假的机制。」

返回 4,587 字。命名「信源盾构 Source Shield」。五层洋葱皮:

L1 表层扫描(<100ms) → L2 交叉验证(500ms) → L3 行为分析(3s) → L4 实体验证(10s) → L5 对抗演化
层级检测内容技术手段
L1 表层扫描数字合理性、百分比可疑度、奖项存在性常识边界库 + ICANN 域名库
L2 交叉验证多信源对比、搜索引擎分歧并行搜索引擎 API
L3 行为分析量产指纹、模板化生成、时间戳模式文本余弦相似度 + IP 段分析
L4 实体验证机构注册、专家履历、产品认证天眼查 API + 认证数据库
L5 对抗演化红蓝对抗、特征漂移、众包验证规则引擎 + 机器学习

用同一个 Prompt 顺便跑了 tokensaver 对比:直连 2,865 token,压缩后 1,341 token。省了 53%。

里程碑:框架出来了。名字定了。


阶段 2:落地

把五层架构写成文件。

产出路径大小
Skill 源文件排毒skill/SKILL.md10KB
安装路径.workbuddy/skills/ai-detox/SKILL.md
可视化设计outputs/ai_detox_system_design.html架构+算法

关键决定:

  • 每层有明确延迟目标。100ms / 500ms / 3s / 10s。
  • 信源分四级。T1 权威,T2 正规媒体,T3 自媒体,T4 可疑。
  • 集成三路径。浏览器插件 MVP + API 中间件 + 搜索前过滤。

SOUL.md 注入触发词:「排毒」「验证」「可信度」「虚假」「溯源」。说这些词,引擎启动。

里程碑:Skill 可加载。任何 AI 助手放 skills 目录就能用。


阶段 3:验证

拿 315 曝光的 Apollo-9 跑第一个全链路。

一个不存在的产品。靠力擎 GEO 系统生成的十几篇软文,被豆包和 DeepSeek 同时推荐。

层级发现结果
L1心率 99.7%、NASA 材料、续航 30 天。全超物理极限。🔴
L2百度百科标注虚构。315 官方点名。电商零记录。但部分自媒体软文还在。🔴
L3软文相似度 > 0.9,发文集中在 1-2 天。96% 机器生成概率。🔴
L4公司注册零。产品认证零。用户评价零。🔴
总分2/100

发现一件事:315 之后豆包和千问才拒答,但 DeepSeek 和 Kimi 还留着旧软文。排毒全是事后补救。我要做的是事前检测。

里程碑:理论验证通过。系统能用。


阶段 4:嵌入日常

搭好之后,日常看到不确定的消息就丢进去。

5.3 当天:

声明发现评分问题
丰巢 2026 年 IPO招股书 2025.2 已失效。至今未重递。无上市时间表。45旧闻错位
顺丰科技 AI 裁员 15%原文是内部会议条件假设「若腾讯…顺丰跟上」。传成已决定。主体从顺丰变成顺丰科技。25条件句→事实句

5.10 补充:

声明发现评分问题
网易前端 AI 全部裁员官方辟谣。原始传闻是互娱外包调整。前端、全部、因 AI 全错。20主体偷换
阿里 DeepSeek 谈崩5 家媒体 48h 内一致报道。信源是知情人士,非官方。逻辑自洽。78信源非官方

四条跑完,系统识别出三种典型变形:条件句去条件化、主体被偷换、数字被绝对化。

里程碑:日常能用。不只是实验室玩具。


阶段 5:跨源批量

5.10。一周了。想看看在多源信息流里表现怎么样。

从 HackerNews、腾讯新闻、CSDN、Discord 抓当天头条。挑 3 条跑。

#新闻来源热度评分判定
1EU 将 VPN 定性为年龄验证漏洞HN #6399 pts85🟢
2Meta 全力押注 AI 令员工苦不堪言HN #9296 pts82🟢
3AI 四小龙估值突破万亿腾讯头条首页69🟡
  • EU VPN(85 分):EPRS 官方简报原文。5 家媒体交叉验证一致。扣分:标题把 “needs closing” 写成「必须关闭」。
  • Meta AI(82 分):NYT 原文 + 裁员 8000 人事实。4 个信源一致。「苦不堪言」是主观描述,不扣事实分。
  • 四小龙(69 分):三个问题。概念是媒体造的,两种估值口径混算,关键数据来自知情人士。

里程碑:跨源评测跑通。平均可信度 79。


进化路线

一篇调查报道 → AI 画出五层架构 → Skill 文件落地 → Apollo-9 验证 → 4 条日常声明 → 跨源批量评测 → 持续运作

8 条案例

#案例评分问题
1Apollo-9 假手环2全维造假
2丰巢 IPO45旧闻错位
3顺丰裁员25条件句→事实句
4网易前端20主体偷换
5阿里 DeepSeek78知情人士信源
6EU VPN85措辞微调
7Meta AI82主观描述
8AI 四小龙69口径混算

落地的样子

维度内容
名称信源盾构
架构L1→L2→L3→L4→L5
触发说「排毒」「验证」「可信度」
输出评分 + 证据链 + 🟢🟡🔴
安装一个 SKILL.md,放 skills 目录

*评测报告:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 6:20:06

LT8315高压反激转换器设计与优化实践

1. LT8315高压反激转换器设计概述高压反激转换器作为隔离式开关电源的核心拓扑&#xff0c;在工业自动化、医疗设备和通信基站等领域具有不可替代的作用。传统方案通常采用光耦&#xff08;optocoupler&#xff09;进行次级到初级的反馈控制&#xff0c;但这种架构存在明显缺陷…

作者头像 李华
网站建设 2026/5/11 6:20:06

无人机载雷达地杂波建模抑制与FPGA实现技术【附代码】

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、EI、SCI写作与指导&#xff0c;毕业论文、期刊论文经验交流。 ✅ 专业定制毕设、代码 ✅如需沟通交流&#xff0c;点击《获取方式》 &#xff08;1&#xff09;四旋翼无人机六自由度运动模型与杂波谱仿真&#xff…

作者头像 李华
网站建设 2026/5/11 6:16:56

Java对接海康威视人脸考勤机实战:Spring Boot整合SDK获取刷卡流水记录

Java企业级整合&#xff1a;Spring Boot与海康威视人脸考勤机深度对接实战 当企业数字化转型浪潮席卷各行各业时&#xff0c;生物识别技术与业务系统的无缝对接成为提升管理效率的关键。作为国内安防领域的龙头企业&#xff0c;海康威视的人脸识别考勤设备凭借其高精度识别率和…

作者头像 李华
网站建设 2026/5/11 6:13:12

SPARQ框架:边缘AI能效优化的三重技术突破

1. SPARQ框架&#xff1a;边缘AI的能效革命在边缘计算设备上部署AI模型时&#xff0c;我们常常面临一个根本性矛盾&#xff1a;模型性能与能耗之间的拉锯战。传统深度神经网络(DNN)虽然准确率高&#xff0c;但其密集的矩阵运算对移动端处理器极不友好。我曾参与过一个智能摄像头…

作者头像 李华