Qwen3-1.7B应用案例：文档摘要生成系统搭建全过程-深圳市維司達科技有限公司

Qwen3-1.7B应用案例：文档摘要生成系统搭建全过程

1. 背景与技术选型

随着大语言模型在自然语言处理领域的广泛应用，自动化文档摘要已成为提升信息处理效率的重要手段。尤其在企业知识管理、科研文献分析和新闻聚合等场景中，快速提取长文本的核心内容具有显著的实用价值。

Qwen3（千问3）是阿里巴巴集团于2025年4月29日开源的新一代通义千问大语言模型系列，涵盖6款密集模型和2款混合专家（MoE）架构模型，参数量从0.6B至235B。其中，Qwen3-1.7B作为轻量级密集模型，在推理速度、资源消耗与语义理解能力之间实现了良好平衡，特别适合部署在边缘设备或资源受限环境中进行实时文本处理任务。

本文将围绕 Qwen3-1.7B 构建一个完整的文档摘要生成系统，重点介绍如何通过 LangChain 框架调用远程模型服务，并实现本地化集成与流式响应支持，最终完成端到端的摘要功能开发。

2. 环境准备与镜像启动

2.1 获取预置镜像

为简化环境配置过程，推荐使用 CSDN 提供的 AI 预置镜像环境。该镜像已集成 Jupyter Notebook、LangChain、Transformers 等常用库，并预配置了对 Qwen3 系列模型的支持。

操作步骤如下：

登录 CSDN星图镜像广场
搜索 “Qwen3” 或选择“通义千问”分类
启动qwen3-runtime镜像实例
实例启动后自动进入 Jupyter Lab 界面

提示：镜像默认开放 8000 端口用于模型 API 通信，请确保防火墙规则允许外部访问（如需公网调用）

2.2 验证运行环境

在 Jupyter 中新建 Python3 Notebook，执行以下命令验证依赖库版本：

!pip show langchain langchain-openai

确保langchain-openai版本不低于0.1.10，以支持自定义base_url和extra_body参数传递。

3. 基于 LangChain 调用 Qwen3-1.7B

3.1 初始化模型客户端

LangChain 提供了统一接口来对接各类 LLM 服务。尽管 Qwen3 并非 OpenAI 官方模型，但其 API 接口兼容 OpenAI 格式，因此可通过ChatOpenAI类进行封装调用。

以下是初始化 Qwen3-1.7B 模型实例的关键代码：

from langchain_openai import ChatOpenAI import os chat_model = ChatOpenAI( model="Qwen3-1.7B", temperature=0.5, base_url="https://gpu-pod69523bb78b8ef44ff14daa57-8000.web.gpu.csdn.net/v1", # 替换为实际 Jupyter 实例地址 api_key="EMPTY", # 当前服务无需认证 extra_body={ "enable_thinking": True, "return_reasoning": True, }, streaming=True, )

参数说明：

参数	说明
`model`	指定调用的模型名称，必须与后端注册名一致
`temperature`	控制输出随机性，值越高越发散，摘要任务建议设为 0.3~0.6
`base_url`	指向运行 Qwen3 的远程服务地址，注意包含`/v1`路径
`api_key`	认证密钥，当前测试环境设为`"EMPTY"`表示免认证
`extra_body`	扩展请求体，启用“思维链”（Thinking Process）和推理路径返回
`streaming`	开启流式传输，实现逐字输出效果，提升交互体验

3.2 测试基础问答能力

调用invoke()方法发送简单请求，验证模型连通性：

response = chat_model.invoke("你是谁？") print(response.content)

预期输出示例：

我是 Qwen3-1.7B，阿里巴巴通义实验室推出的超大规模语言模型，擅长多轮对话、知识问答、文本创作等任务。

图注：Jupyter 中成功调用 Qwen3-1.7B 并获得响应

4. 文档摘要系统设计与实现

4.1 系统架构概览

整个摘要系统的结构分为三层：

输入层：接收原始文档（支持.txt,.pdf,.docx等格式）
处理层：利用 LangChain 进行文本分割、提示工程与模型调用
输出层：返回结构化摘要结果（含标题、要点、关键词）

[文档上传] ↓ [文本解析 → 分块处理] ↓ [构建 Prompt → 调用 Qwen3-1.7B] ↓ [摘要生成 ← 流式返回] ↓ [结果展示 + 导出]

4.2 文本预处理模块

对于长文档，直接输入可能导致上下文溢出。因此需先进行分块处理。

from langchain.text_splitter import RecursiveCharacterTextSplitter def load_and_split_text(file_path, chunk_size=1024, chunk_overlap=128): with open(file_path, 'r', encoding='utf-8') as f: text = f.read() splitter = RecursiveCharacterTextSplitter( chunk_size=chunk_size, chunk_overlap=chunk_overlap, separators=["\n\n", "\n", "。", "！", "？", "；"] ) return splitter.split_text(text)

4.3 构建摘要提示词模板

高质量的 Prompt 是保证摘要质量的关键。我们采用“角色+任务+格式”三段式设计：

from langchain.prompts import ChatPromptTemplate SUMMARY_PROMPT_TEMPLATE = """ 你是一位专业的文档分析师，请根据以下内容生成简洁准确的中文摘要。 要求： 1. 提取核心主题和关键信息点 2. 使用第三人称客观叙述 3. 输出不超过150字 4. 包括一个主标题（加粗）和三个要点（列表形式） 原文内容： {content} """ prompt = ChatPromptTemplate.from_template(SUMMARY_PROMPT_TEMPLATE)

4.4 完整摘要生成流程

结合上述组件，构建完整的摘要函数：

def generate_summary(file_path): # 步骤1：加载并分块 chunks = load_and_split_text(file_path, chunk_size=1024) # 步骤2：拼接前两块作为输入（可根据需求扩展） combined_content = "\n".join(chunks[:2]) # 步骤3：构造 prompt 并调用模型 formatted_prompt = SUMMARY_PROMPT_TEMPLATE.format(content=combined_content) print("正在生成摘要...\n") response = chat_model.invoke(formatted_prompt) return response.content # 使用示例 summary = generate_summary("sample_document.txt") print(summary)

示例输出：

人工智能驱动下的教育变革

利用AI个性化学习路径提升学生效率
智能批改系统减轻教师负担
数据驱动教学决策成为可能

5. 性能优化与实践建议

5.1 分块策略优化

对科技类文档，优先按章节划分（\n##）
法律文书可依据条款编号切分
新闻稿建议保留完整段落，避免截断事件描述

5.2 缓存机制引入

为减少重复调用成本，可加入本地缓存：

import hashlib import pickle from pathlib import Path CACHE_DIR = Path(".cache") CACHE_DIR.mkdir(exist_ok=True) def get_cache_key(text): return CACHE_DIR / (hashlib.md5(text.encode()).hexdigest() + ".pkl") def cached_invoke(prompt): key = get_cache_key(prompt) if key.exists(): with open(key, 'rb') as f: return pickle.load(f) else: result = chat_model.invoke(prompt) with open(key, 'wb') as f: pickle.dump(result, f) return result

5.3 错误处理与重试机制

网络不稳定时应具备容错能力：

from tenacity import retry, stop_after_attempt, wait_exponential @retry(stop=stop_after_attempt(3), wait=wait_exponential(multiplier=1, max=10)) def robust_invoke(prompt): return chat_model.invoke(prompt)