Python安装Langchain-Chatchat全流程保姆级教程-深圳市維司達科技有限公司

Python安装Langchain-Chatchat全流程保姆级教程

在企业知识管理日益复杂的今天，员工常常面临“文档太多找不到、政策模糊问不清”的困境。而市面上的通用AI助手虽然能说会道，却对公司的内部制度一无所知。更关键的是——把敏感文件上传到云端？这在金融、医疗或政府机构几乎是不可能的任务。

有没有一种方案，既能拥有智能问答的能力，又能确保数据完全留在本地？

答案是：有，而且已经开源了。

Langchain-Chatchat正是这样一个项目。它基于 LangChain 框架，将大语言模型（LLM）、向量数据库和私有文档深度融合，实现了一个可完全本地部署的知识问答系统。你可以把自己的PDF手册、Word制度、TXT日志统统喂给它，然后像和人聊天一样提问：“我们年假怎么算？”、“项目审批流程是什么？”——它不仅能答，还能告诉你答案来自哪份文件。

听起来很复杂？其实不然。只要你会用pip install，就能一步步搭起来。

从零开始：环境准备与依赖安装

我们先从最基础的 Python 环境说起。

确保你本地已安装Python 3.10 或以上版本（推荐 3.10~3.11，部分包对 3.12 支持还不稳定）。打开终端执行：

python --version

确认无误后，建议创建一个独立的虚拟环境，避免依赖冲突：

python -m venv lc_chatchat_env source lc_chatchat_env/bin/activate # Linux/Mac # 或者 Windows： # lc_chatchat_env\Scripts\activate

接下来安装核心依赖。Langchain-Chatchat实际上是一个前端+后端+模型联动的完整项目，但我们今天聚焦于Python 后端的核心链路搭建。

执行以下命令安装关键组件：

pip install langchain langchain-community langchain-core langchain-huggingface pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 # 使用CUDA 11.8（根据你的GPU选择） pip install faiss-gpu # 若无GPU则使用 faiss-cpu pip install sentence-transformers PyPDF2 python-docx chromadb pip install flask requests tqdm

💡 小贴士：如果你没有 NVIDIA 显卡，可以使用faiss-cpu和 CPU 推理模型（如 Ollama），虽然速度慢些，但也能跑通全流程。

此时，LangChain 的基本能力已经就绪。我们可以开始构建第一个“会读书”的AI了。

让AI读懂你的文档：文本加载与分块处理

真正的智能不是背书，而是理解内容并准确引用。要做到这一点，第一步就是让系统“消化”你的文档。

假设你有一份名为company_policy.pdf的公司制度文件，我们要做的第一件事是把它变成机器可处理的文本片段。

LangChain 提供了丰富的DocumentLoader，支持 PDF、DOCX、HTML、Markdown 等格式。以 PDF 为例：

from langchain.document_loaders import PyPDFLoader loader = PyPDFLoader("company_policy.pdf") pages = loader.load() # 返回 Document 对象列表

每一页都被解析成一个Document(page_content=..., metadata={...})结构。但直接把这些整页内容丢进模型显然不合适——太长了！我们需要切分成语义完整的“小段落”。

这里推荐使用RecursiveCharacterTextSplitter，它是目前最常用的分块策略之一：

from langchain.text_splitter import RecursiveCharacterTextSplitter text_splitter = RecursiveCharacterTextSplitter( chunk_size=500, # 每块约500字符 chunk_overlap=50, # 块之间重叠50字符，防止切断句子 separators=["\n\n", "\n", "。", "！", "？", " ", ""] ) docs = text_splitter.split_documents(pages)

这个分块器会优先按双换行（段落）切分，再按单换行（句子），最后才是字符级别。这样能最大程度保留上下文完整性。

你可以打印一下docs[0].page_content看看效果：

“第一章 总则 第一条 为规范员工行为……本制度适用于全体正式员工。”

很好，不再是整页乱码，而是一段清晰、独立的内容单元。

把文字变成向量：嵌入模型的选择与应用

现在我们有了文本块，下一步是让AI“理解”它们的意思。但这不是靠阅读，而是通过数学方式——将每段文字编码为高维向量。

这就是“嵌入模型”（Embedding Model）的作用。它像一台翻译机，把“年假申请需提前3天提交”这样的句子，转换成一串数字（比如[0.23, -0.45, ..., 0.67]），这些数字在向量空间中彼此靠近的程度，代表语义上的相似性。

中文场景下，强烈推荐使用经过优化的中文嵌入模型：

from langchain.embeddings import HuggingFaceEmbeddings embeddings = HuggingFaceEmbeddings( model_name="GanymedeNil/text2vec-large-chinese" # 中文增强版 )

⚠️ 注意：不要随便换模型！训练时用的嵌入模型必须和查询时一致，否则向量空间不匹配，检索就会失效。

有了嵌入模型，就可以把所有文本块“向量化”并存入数据库了。

存储与检索：向量数据库实战（Chroma + FAISS）

有两种主流选择：轻量级的Chroma和高性能的FAISS。

方案一：快速验证用 Chroma

适合开发调试，纯 Python 实现，无需额外服务：

from langchain.vectorstores import Chroma vectorstore = Chroma.from_documents( documents=docs, embedding=embeddings, persist_directory="./chroma_db" # 自动持久化 )

就这么简单，一个可搜索的知识库就建好了。

方案二：生产级选 FAISS

若追求更快的检索速度，尤其是大规模知识库，FAISS 更合适：

from langchain.vectorstores import FAISS vectorstore = FAISS.from_documents(docs, embeddings) vectorstore.save_local("faiss_index") # 保存到磁盘

以后每次启动只需加载：

vectorstore = FAISS.load_local( "faiss_index", embeddings, allow_dangerous_deserialization=True # 允许加载旧格式 )

🔒 安全提醒：allow_dangerous_deserialization=True存在反序列化风险，仅限可信环境启用。生产系统建议配合签名校验或改用安全存储格式。

搭建问答链条：LangChain 的“组装艺术”

到现在为止，我们完成了“知识入库”。接下来要让它“开口说话”。

LangChain 的精髓在于“链式思维”——把复杂任务拆解为多个模块，像搭积木一样组合起来。

对于问答系统，典型的链路是：

用户问题 → 向量化 → 检索Top-K相关文本 → 拼接Prompt → 输入LLM → 输出回答

LangChain 提供了现成的RetrievalQA链来封装这一流程：

from langchain.chains import RetrievalQA from langchain.llms import OpenAI # 示例调用OpenAI API

但我们要强调的是：你可以完全不用云API。

本地模型接入（以 Ollama 为例）

Ollama 是近年来非常流行的本地 LLM 运行工具，支持一键拉取和运行量化模型（如 Llama3、Qwen 等）。

先去 https://ollama.com 下载安装，然后运行：

ollama pull qwen:7b-chat-q4_K_M ollama run qwen:7b-chat-q4_K_M

接着在 Python 中通过 API 调用它：

pip install langchain-ollama

from langchain_ollama import OllamaLLM llm = OllamaLLM( model="qwen:7b-chat-q4_K_M", temperature=0.7, num_predict=2048 ) qa_chain = RetrievalQA.from_chain_type( llm=llm, chain_type="stuff", retriever=vectorstore.as_retriever(search_kwargs={"k": 3}), return_source_documents=True )

现在，试试提问：

result = qa_chain.invoke("年假是怎么规定的？") print("回答：", result["result"]) print("\n参考来源：") for i, doc in enumerate(result["source_documents"]): print(f"[{i+1}] {doc.metadata['source']} (页码: {doc.metadata.get('page', 'N/A')})") print(doc.page_content[:200] + "...\n")

你会看到 AI 不仅给出了答案，还列出了出处——这才是可信 AI 的关键。

工程实践中的那些“坑”，我都替你踩过了

别以为装完就万事大吉。实际落地时，有几个常见问题必须面对。

❌ 问题1：回答总是“我不知道”或胡编乱造

原因可能是：
- 分块太大，关键信息被稀释；
- 嵌入模型不擅长中文，语义没对齐；
- Prompt 模板不适合当前模型（比如用了 Alpaca 格式但模型期望是 ChatML）。

✅ 解决方案：
- 调整chunk_size=300~600，保持语义完整；
- 使用专为中文优化的text2vec或BGE系列模型；
- 显式设置prompt_template，例如：

from langchain.prompts import PromptTemplate template = """使用以下上下文信息回答问题。如果无法从中得到答案，请说“我不知道”。不要编造答案。 ------------ {context} ------------ 问题: {question} 答案:""" PROMPT = PromptTemplate(template=template, input_variables=["context", "question"]) qa_chain.combine_documents_chain.llm_chain.prompt = PROMPT

❌ 问题2：响应太慢，CPU跑不动

LangChain 默认是同步阻塞的，一旦模型推理耗时长，整个接口就卡住。

✅ 解决方案：
- 生产环境务必使用 GPU 加速（哪怕只是入门级显卡）；
- 引入异步机制，例如用 FastAPI 替代 Flask；
- 缓存高频问题结果，减少重复计算。

❌ 问题3：新增文档后知识没更新

很多人重建整个向量库，费时又低效。

✅ 正确做法：支持增量更新

# 新增文档时，只添加新部分 new_loader = PyPDFLoader("new_policy_update.pdf") new_docs = text_splitter.split_documents(new_loader.load()) new_vectors = embeddings.embed_documents([d.page_content for d in new_docs]) # 直接添加到现有数据库（FAISS支持） vectorstore.add_documents(new_docs) vectorstore.save_local("faiss_index") # 覆盖保存

它能做什么？真实应用场景一览

这套技术栈绝非玩具，已在多个领域落地：

企业HR助手：员工随时查薪酬结构、请假流程，减少重复咨询；
技术支持中心：工程师输入故障代码，系统自动匹配历史案例；
法律事务所：律师上传过往合同模板，快速生成新协议初稿；
科研团队：基于自有论文库做文献问答，提升研究效率；
政务窗口：群众询问办事流程，系统精准指引所需材料。

更重要的是，这一切都不需要把任何数据传出去。

写在最后：为什么这件事值得你花时间

Langchain-Chatchat 的意义，远不止“本地跑个AI聊天机器人”这么简单。

它代表着一种新的可能性：组织的知识不再沉睡在硬盘里，而是真正“活”了起来。

过去，一份PDF只是静态文件；今天，它可以成为随时应答的专家。

而这一切的技术门槛，已经被 LangChain 和开源社区大大降低。你不需要懂 Transformer 架构，也不需要自己训练模型，只需要掌握几个核心组件的协作逻辑，就能构建出属于自己的“专属AI顾问”。

当然，挑战依然存在：如何优化分块策略？怎样平衡响应速度与准确性？是否需要引入多模态支持图片或表格？

这些问题没有标准答案，但正是探索的过程，让我们离真正的智能更近一步。

如果你正在寻找一个既能练手又有实际价值的 AI 项目，那Langchain-Chatchat绝对值得投入时间。当你第一次看到它准确回答出“去年Q3营收是多少？”并附上财报原文截图时，那种成就感，只有亲手做过的人才懂。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

Python安装Langchain-Chatchat全流程保姆级教程