LlamaIndex 入门指南：构建智能问答系统的利器-深圳市維司達科技有限公司

什么是 LlamaIndex？

LlamaIndex（前身为 GPT Index）是一个专为大语言模型（LLM）应用设计的数据框架。它解决了一个核心问题：如何让 LLM 能够访问和理解你的私有数据？无论是文档、数据库还是 API，LlamaIndex 都能帮助你构建强大的检索增强生成（RAG）应用。

核心概念

在开始使用之前，让我们了解几个关键概念：

索引（Index）：LlamaIndex 将你的数据组织成易于检索的结构。最常用的是向量索引（VectorStoreIndex），它将文本转换为向量嵌入，支持语义搜索。

查询引擎（Query Engine）：这是你与数据交互的接口。你提出问题，查询引擎会检索相关信息并生成回答。

节点（Node）：数据被分割成的基本单元。每个节点包含一段文本及其元数据。

安装与设置

首先安装 LlamaIndex：

pipinstallllama-index

设置你的 OpenAI API 密钥（或其他 LLM 提供商）：

importos os.environ["OPENAI_API_KEY"]="your-api-key"

基本使用流程

1. 加载数据

LlamaIndex 支持多种数据源。最简单的方式是从文本文件开始：

fromllama_index.coreimportSimpleDirectoryReader# 从目录加载文档documents=SimpleDirectoryReader("./data").load_data()

2. 创建索引

将文档转换为可查询的索引：

fromllama_index.coreimportVectorStoreIndex# 创建向量索引index=VectorStoreIndex.from_documents(documents)

这一步会自动：

将文档分割成节点
为每个节点生成向量嵌入
存储到向量数据库中

3. 查询数据

现在你可以开始提问了：

# 创建查询引擎query_engine=index.as_query_engine()# 提问response=query_engine.query("这份文档的主要内容是什么？")print(response)

进阶技巧

自定义分块策略

控制文本如何被分割：

fromllama_index.core.node_parserimportSentenceSplitter# 自定义分块大小text_splitter=SentenceSplitter(chunk_size=512,chunk_overlap=50)index=VectorStoreIndex.from_documents(documents,transformations=[text_splitter])

持久化索引

避免每次都重新构建索引：

# 保存索引index.storage_context.persist(persist_dir="./storage")# 加载已保存的索引fromllama_index.coreimportStorageContext,load_index_from_storage storage_context=StorageContext.from_defaults(persist_dir="./storage")index=load_index_from_storage(storage_context)

使用不同的 LLM

LlamaIndex 支持多种语言模型：

fromllama_index.llms.anthropicimportAnthropicfromllama_index.coreimportSettings# 使用 ClaudeSettings.llm=Anthropic(model="claude-3-5-sonnet-20241022")

流式响应

对于长答案，可以使用流式输出：

query_engine=index.as_query_engine(streaming=True)response=query_engine.query("详细解释一下...")# 逐步打印响应fortextinresponse.response_gen:print(text,end="",flush=True)

实用示例：构建文档问答系统

让我们整合以上知识，构建一个完整的应用：

fromllama_index.coreimportVectorStoreIndex,SimpleDirectoryReader,Settingsfromllama_index.core.node_parserimportSentenceSplitter# 配置Settings.chunk_size=512Settings.chunk_overlap=50# 加载文档print("正在加载文档...")documents=SimpleDirectoryReader("./docs").load_data()# 创建索引print("正在构建索引...")index=VectorStoreIndex.from_documents(documents)# 保存索引index.storage_context.persist()# 创建查询引擎query_engine=index.as_query_engine(similarity_top_k=3,# 返回最相关的3个节点response_mode="compact"# 紧凑模式)# 交互式问答whileTrue:question=input("\n请输入你的问题（输入 'quit' 退出）：")ifquestion.lower()=='quit':breakresponse=query_engine.query(question)print(f"\n回答：{response}\n")# 显示来源print("参考来源：")fornodeinresponse.source_nodes:print(f"-{node.node.metadata.get('file_name','Unknown')}")