Kotaemon能否检测虚假信息？事实核查功能初探-深圳市維司達科技有限公司

Kotaemon能否检测虚假信息？事实核查功能初探

在社交媒体和即时通讯工具空前发达的今天，一条未经证实的“健康建议”或“政策解读”可能在几分钟内传遍全网。更令人担忧的是，随着大语言模型生成内容的能力越来越强，AI 本身也成了虚假信息传播链中的一环——它能以极高的语言流畅度输出看似可信但实则虚构的答案。这种“幻觉”问题不是小瑕疵，而是直接影响用户决策的风险点。

比如有人问：“喝漂白剂可以杀死体内的新冠病毒吗？” 如果一个没有防护机制的 AI 回答“是的，有消毒作用”，后果不堪设想。那么，我们是否有可能构建一种智能系统，在回答前先查证事实、追溯来源，并对可疑声明主动质疑？这正是Kotaemon所尝试解决的问题。

RAG：让AI不再“凭空编造”

要让 AI 具备事实核查能力，第一步就是打破它对内部参数记忆的依赖。传统的大模型之所以会“幻觉”，是因为它们本质上是在模仿训练数据中的语言模式，而不是真正理解知识。而检索增强生成（RAG）的出现，为这一困境提供了结构性解法。

简单来说，RAG 不再让模型“靠脑子想答案”，而是要求它“先查资料再作答”。这个过程分为三步：

用户提问后，系统首先将问题转化为语义向量；
在预建的知识库中搜索最相关的文档片段（例如维基百科条目、医学论文摘要）；
把这些真实存在的文本作为上下文输入给生成模型，指导其产出答案。

这样一来，模型的回答就有了“出处”。哪怕它的表达方式很自然，核心信息也锚定在可验证的数据源上。更重要的是，这种架构支持动态更新——只要替换了知识库里的内容，AI 就能立刻掌握最新共识，无需重新训练。

下面是一段典型的 RAG 实现代码：

from transformers import RagTokenizer, RagRetriever, RagSequenceForGeneration tokenizer = RagTokenizer.from_pretrained("facebook/rag-sequence-nq") retriever = RagRetriever.from_pretrained( "facebook/rag-sequence-nq", index_name="exact", use_dummy_dataset=True ) model = RagSequenceForGeneration.from_pretrained("facebook/rag-sequence-nq", retriever=retriever) def generate_answer(question: str): input_dict = tokenizer.prepare_seq2seq_batch([question], return_tensors="pt") generated = model.generate(input_ids=input_dict["input_ids"]) return tokenizer.batch_decode(generated, skip_special_tokens=True)[0] answer = generate_answer("Who wrote 'Pride and Prejudice'?") print(answer) # 输出: Jane Austen

虽然这里用了 Hugging Face 提供的简化版实现，但在实际部署中，我们会用 FAISS 或 Elasticsearch 构建专用索引，接入企业私有数据库或权威公开资源。关键是：所有答案都必须基于检索结果生成，否则就违背了 RAG 的初衷。

多轮对话中的“一致性监控”

单次问答的准确性只是基础，真正的挑战在于长期交互中的逻辑自洽。试想这样一个场景：

用户说：“我听说维生素C能防新冠。”
系统回应：“目前尚无充分证据支持该说法。（来源：WHO）”
几轮之后，用户又说：“但我朋友说CDC明确推荐了。”
此时如果系统毫无反应，等于默认接受了矛盾信息。

而在 Kotaemon 中，这类问题可以通过多轮对话管理机制被捕捉到。系统会维护一个轻量级的对话状态，记录关键实体、意图以及信息来源。当新输入与已有记录冲突时，它可以主动发起追问或提醒。

举个例子：

class DialogueState: def __init__(self): self.history = [] self.slots = {} self.current_intent = None def update(self, user_input, intent, filled_slots): self.history.append({"user": user_input}) self.current_intent = intent self.slots.update(filled_slots) def get_context(self, max_turns=3): return self.history[-max_turns:] state = DialogueState() def handle_conversation(user_input, detected_intent, extracted_slots): state.update(user_input, detected_intent, extracted_slots) if "source" in extracted_slots: existing_source = state.slots.get("source") new_source = extracted_slots["source"] if existing_source and existing_source != new_source: return "注意：您之前提到的信息来源与此处不同，是否需要核实？" return "已记录您的信息，请继续提供细节。"

这段代码虽然简陋，却体现了一个重要理念：AI 不应只是被动应答者，还应是信息一致性的守护者。在医疗咨询、法律答疑等高风险场景中，这种跨轮次的记忆与校验能力尤为关键。

工具调用：打通实时信源的“最后一公里”

即便有了高质量知识库，静态数据仍有局限。科学结论在演进，政策法规在调整，网络谣言也在不断变异。因此，仅靠本地检索还不够，系统还需要具备访问外部权威服务的能力。

这就是工具调用（Tool Calling）发挥作用的地方。Kotaemon 支持插件化架构，允许开发者注册各种功能性接口，如网页爬取、学术搜索引擎、政府公告查询，甚至是第三方事实核查平台的 API。

假设用户提出：“有人说5G基站会导致脱发，是真的吗？” 系统可以自动执行以下流程：

判断该主张属于公共健康类谣言；
触发verify_claim工具调用；
向 Snopes 或 Google Fact Check Tools 发起请求；
获取评级结果（如“False”）及相关引用；
返回结构化回应：“该说法已被多家机构辟谣。（来源：Snopes, WHO）”

实现类似功能的代码如下：

import requests def verify_claim_with_factcheck_api(claim: str) -> dict: url = "https://api.factchecktools.v1.example.com/verify" payload = {"query": claim} headers = {"Authorization": "Bearer YOUR_API_KEY"} try: response = requests.post(url, json=payload, headers=headers, timeout=10) return response.json() except Exception as e: return {"error": str(e)} tool_call_request = { "tool": "verify_claim", "arguments": {"claim": "Drinking bleach cures COVID-19"} } if tool_call_request["tool"] == "verify_claim": result = verify_claim_with_factcheck_api(tool_call_request["arguments"]["claim"]) print("Fact-check Result:", result)

这种方式将主观判断转化为客观验证，极大提升了系统的可信度。当然，在实际使用中也要注意成本控制和隐私保护——不是每个查询都需要调用昂贵的外部 API，敏感话题也应限制日志留存。