news 2026/5/9 19:11:54

构建一个LangChain RAG应用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
构建一个LangChain RAG应用

构建一个LangChain RAG应用

01. 外挂知识库的聊天机器人架构

在 RAG 应用中,会通过外部的检索器/知识库检索人类的提问,然后将检索到的信息填充到提示模板中,一起传递给大语言模型,让其生成特定的内容,无论 RAG 应用有多么复杂,底层一定少不了这个步骤,这也是 RAG 的基础架构。

所以在 LangChain 中,也可以按照上述的流程图,将聊天机器人添加上知识库问答功能,思路其实非常简单:

  1. 和 Postgres 一样实例化一个全局的 Weaviate 向量数据库,避免每次调用时才进行连接,提升效率。
  2. 在聊天应用中,将 Weaviate 转换成检索器,并将生成的 Document 列表转换成字符串。
  3. 将处理好的检索器拼接到 LCEL 链输入字典中,用户提问时,检索对应内容并填充到 Prompt 模板中,从而实现知识外挂。

02. 外挂知识库的聊天机器人示例

在 LLMOps 项目中,我们对接的是 Weaviate 向量数据库,可以使用云端的向量数据库,也可以使用 Docker 搭建的向量数据库,两者并没有使用差异,修改后的代码如下。

集成的向量数据库服务

# internal/service/vector_database_service.py

import os

import weaviate

from injector import inject

from langchain_core.documents import Document

from langchain_core.vectorstores import VectorStoreRetriever

from langchain_openai import OpenAIEmbeddings

from langchain_weaviate import WeaviateVectorStore

from weaviate import WeaviateClient

@inject

class VectorDatabaseService:

"""向量数据库服务"""

client: WeaviateClient

vector_store: WeaviateVectorStore

def __init__(self):

"""构造函数,完成向量数据库服务的客户端+LangChain向量数据库实例的创建"""

# 1.创建/连接weaviate向量数据库

self.client = weaviate.connect_to_local(

host=os.getenv("WEAVIATE_HOST"),

port=int(os.getenv("WEAVIATE_PORT"))

)

# 2.创建LangChain向量数据库

self.vector_store = WeaviateVectorStore(

client=self.client,

index_name="Dataset",

text_key="text",

embedding=OpenAIEmbeddings(model="text-embedding-3-small")

)

def get_retriever(self) -> VectorStoreRetriever:

"""获取检索器"""

return self.vector_store.as_retriever()

@classmethod

def combine_documents(cls, documents: list[Document]) -> str:

"""将对应的文档列表使用换行符进行合并"""

return "\n\n".join([document.page_content for document in documents])

配置信息:

# Weaviate向量数据库配置

WEAVIATE_HOST=192.168.2.120

WEAVIATE_PORT=8080

聊天机器人处理器:

def debug(self, app_id: UUID):

# 4.创建链应用

retriever = self.vector_database_service.get_retriever() | self.vector_database_service.combine_documents

chain = (RunnablePassthrough.assign(

history=RunnableLambda(self._load_memory_variables) | itemgetter("history"),

context=itemgetter("query") | retriever

) | prompt | llm | StrOutputParser()).with_listeners(on_end=self._save_context)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 7:41:40

cosyVoiceV50功能改进版(自制)

在b站两位大佬:“王知风”和“刘悦的技术博客”的启发下。以王知风大佬的cosyVoiceV50项目为基地,我在基础上增加了自定义音色池的功能。 可以将【3s极速复刻,跨语种复刻】2中模式克隆出的音色添加到预训练音色中,成为自定义音色池在预训练模…

作者头像 李华
网站建设 2026/5/6 22:47:21

Node.js Redis客户端ioredis完整使用指南

Node.js Redis客户端ioredis完整使用指南 【免费下载链接】ioredis 项目地址: https://gitcode.com/gh_mirrors/ior/ioredis 还在为Node.js项目中如何高效连接Redis而烦恼吗?ioredis作为当前最流行的Redis客户端,提供了简单直观的API和强大的功能…

作者头像 李华
网站建设 2026/5/4 8:07:17

VinylMusicPlayer:Android 开源音乐播放器完整使用指南

VinylMusicPlayer:Android 开源音乐播放器完整使用指南 【免费下载链接】VinylMusicPlayer A material designed music player for Android 项目地址: https://gitcode.com/gh_mirrors/vi/VinylMusicPlayer VinylMusicPlayer 是一款基于 Material Design 设计…

作者头像 李华
网站建设 2026/5/9 16:44:49

3步打造Switch专属开机动画:让你的主机从启动就与众不同

每次开启Switch,那个千篇一律的开机画面是否让你感到审美疲劳?今天,我将为你揭秘一个简单却强大的个性化技巧——通过自定义bootlogo让你的主机从启动瞬间就充满个性。这不是复杂的系统修改,而是通过巧妙的视觉设计实现的完美定制…

作者头像 李华
网站建设 2026/5/5 14:55:29

3步快速掌握EcoPaste:跨平台剪贴板管理的终极指南

3步快速掌握EcoPaste:跨平台剪贴板管理的终极指南 【免费下载链接】EcoPaste 🎉跨平台的剪贴板管理工具 | Cross-platform clipboard management tool 项目地址: https://gitcode.com/ayangweb/EcoPaste EcoPaste是一款开源的跨平台剪贴板管理工具…

作者头像 李华
网站建设 2026/4/29 17:33:01

终极防抖方案:MediaPipe如何让手机拍摄告别抖动困扰

终极防抖方案:MediaPipe如何让手机拍摄告别抖动困扰 【免费下载链接】mediapipe Cross-platform, customizable ML solutions for live and streaming media. 项目地址: https://gitcode.com/GitHub_Trending/med/mediapipe 在移动拍摄时代,视频防…

作者头像 李华