Qwen3-1.7B保姆级教程：图文详解Jupyter与LangChain集成-深圳市維司達科技有限公司

Qwen3-1.7B保姆级教程：图文详解Jupyter与LangChain集成

1. 引言

1.1 学习目标

本文旨在为开发者提供一份完整的Qwen3-1.7B 模型在 Jupyter 环境中与 LangChain 集成的实践指南。通过本教程，您将掌握：

如何启动并配置支持 Qwen3-1.7B 的 AI 镜像环境
在 Jupyter Notebook 中调用大模型的核心方法
使用langchain_openai接口对接本地部署的大模型服务
启用流式输出、思维链（Thinking）等高级功能
实现基础对话调用与响应解析

完成本教程后，您将能够基于 Qwen3-1.7B 快速搭建本地化 LLM 应用原型，适用于智能问答、Agent 开发、RAG 系统构建等场景。

1.2 前置知识

建议读者具备以下基础知识：

Python 编程基础
Jupyter Notebook 的基本操作
对大语言模型（LLM）和 API 调用有初步了解
了解 LangChain 框架的基本概念（如 ChatModel）

无需深度学习或模型训练经验，适合初学者和中级开发者快速上手。

2. 技术背景与环境准备

2.1 Qwen3-1.7B 模型简介

Qwen3（千问3）是阿里巴巴集团于2025年4月29日开源的新一代通义千问大语言模型系列，涵盖6款密集模型和2款混合专家（MoE）架构模型，参数量从0.6B至235B。其中Qwen3-1.7B是一款轻量级但性能出色的中等规模模型，具备以下特点：

高推理效率：适合在单卡 GPU 上进行低延迟推理
强通用能力：在代码生成、逻辑推理、多轮对话等任务上表现优异
易于部署：支持多种推理框架（vLLM、TGI 等），可快速集成到应用系统中
开放可扩展：作为开源模型，支持微调、蒸馏、量化等二次开发

该模型特别适用于资源受限环境下的本地化部署，是构建私有化 AI Agent 或企业内部工具的理想选择。

2.2 环境获取与镜像启动

本文所使用的运行环境基于 CSDN 提供的预置 AI 镜像平台，已集成 vLLM + FastAPI + WebUI + Jupyter 的完整推理服务栈。

启动步骤如下：

登录 CSDN星图镜像广场
搜索 “Qwen3” 相关镜像（如qwen3-vllm-jupyter）
创建实例并选择合适的 GPU 规格（推荐至少 16GB 显存）
等待镜像初始化完成（约2-3分钟）
进入 Web IDE 或直接打开 Jupyter Notebook 服务

提示：默认 Jupyter 地址通常为https://<instance-id>.web.gpu.csdn.net，端口为8000，具体以实际界面显示为准。

3. LangChain 集成实现详解

3.1 安装依赖库

虽然镜像中已预装大部分常用库，但仍建议检查并安装关键组件：

!pip install langchain langchain-openai --quiet

注意：使用langchain-openai包可以兼容任何遵循 OpenAI API 协议的服务端，包括本地部署的 Qwen3 推理接口。

3.2 初始化 Chat 模型实例

我们通过ChatOpenAI类来封装对 Qwen3-1.7B 的调用，关键参数说明如下：

from langchain_openai import ChatOpenAI import os chat_model = ChatOpenAI( model="Qwen3-1.7B", temperature=0.5, base_url="https://gpu-pod69523bb78b8ef44ff14daa57-8000.web.gpu.csdn.net/v1", # 替换为你的实际 Jupyter 地址，注意端口为8000 api_key="EMPTY", # 因为未设置鉴权，使用占位符 extra_body={ "enable_thinking": True, # 启用“思考过程”模式 "return_reasoning": True, # 返回中间推理步骤 }, streaming=True, # 开启流式输出，逐字返回结果 )

参数解析：

参数	说明
`model`	指定调用的模型名称，需与后端注册名一致
`temperature`	控制生成随机性，值越高越发散（0.0~1.0）
`base_url`	指向本地运行的 FastAPI 推理服务`/v1`接口
`api_key`	若服务无认证，可用`"EMPTY"`占位
`extra_body`	扩展字段，用于传递自定义控制指令
`streaming`	是否启用流式传输，提升用户体验

⚠️重要提醒：请务必根据您的实际实例地址替换base_url，否则无法连接模型服务。

3.3 发起模型调用

调用方式非常简洁，只需调用.invoke()方法即可：

response = chat_model.invoke("你是谁？") print(response.content)

输出示例（模拟）：

我是通义千问3（Qwen3），由阿里巴巴研发的大规模语言模型。我可以回答问题、创作文字、编程、表达观点等。我支持中文、英文等多种语言，并具备强大的逻辑推理和知识理解能力。

3.4 支持流式输出的交互式调用

由于设置了streaming=True，我们可以监听每一个 token 的生成过程，实现“打字机”效果：

def on_chunk(chunk): print(chunk.content, end="", flush=True) for chunk in chat_model.stream("请用三句话介绍你自己。"): on_chunk(chunk)

效果说明：

每个chunk是一个增量更新的对象
content字段包含新增的文字片段
实时打印，形成流畅的逐字输出体验

这在构建聊天机器人或可视化 Agent 时非常有用。

3.5 启用思维链（Chain-of-Thought）推理

通过extra_body中的enable_thinking和return_reasoning参数，可以让模型返回其“思考过程”，便于调试和增强可解释性。

示例调用：

chat_model_with_thinking = ChatOpenAI( model="Qwen3-1.7B", temperature=0.3, base_url="https://gpu-pod69523bb78b8ef44ff14daa57-8000.web.gpu.csdn.net/v1", api_key="EMPTY", extra_body={ "enable_thinking": True, "return_reasoning": True, }, streaming=False, ) result = chat_model_with_thinking.invoke("小明有5个苹果，吃了2个，又买了3个，还剩几个？") print(result.content)

可能返回内容：

思考过程： 1. 小明最开始有5个苹果。 2. 吃了2个，剩下 5 - 2 = 3 个。 3. 又买了3个，现在有 3 + 3 = 6 个。 最终答案：6个。

此功能对于数学计算、逻辑推理类任务极具价值，有助于提升结果可靠性。

4. 常见问题与解决方案

4.1 连接失败：`ConnectionError`或`404 Not Found`

原因分析：

base_url地址错误
端口号不正确（应为8000）
模型服务未完全启动

解决办法：

检查镜像控制台日志，确认 vLLM 服务已就绪
访问base_url根路径（去掉/v1）查看是否返回健康检查页面
确保 URL 以/v1结尾，符合 OpenAI 兼容接口规范

4.2 返回空内容或乱码

可能原因：

api_key设置不当
模型负载过高导致响应异常
输入文本包含非法字符

建议做法：

使用默认api_key="EMPTY"，除非服务端明确要求密钥
减少并发请求，避免超时
对输入做基本清洗（去除不可见字符）

4.3 流式输出中断或卡顿

优化建议：

升级到更高带宽的网络环境
减小max_tokens限制，降低单次生成长度
在生产环境中使用 WebSocket 替代 HTTP 流

4.4 如何查看模型支持的功能列表？

可通过发送以下请求获取模型元信息：

import requests url = "https://gpu-pod69523bb78b8ef44ff14daa57-8000.web.gpu.csdn.net/v1/models" response = requests.get(url) print(response.json())

返回结果将包含模型名称、上下文长度、是否支持函数调用等信息。

5. 总结

5.1 核心要点回顾

本文系统地介绍了如何在 Jupyter 环境中集成 Qwen3-1.7B 大模型，并通过 LangChain 实现高效调用。主要收获包括：

环境准备清晰：通过 CSDN 星图平台一键启动预置镜像，省去复杂部署流程。
接口兼容性强：利用langchain_openai.ChatOpenAI接口，轻松对接非 OpenAI 自家的模型服务。
功能丰富实用：支持流式输出、思维链推理、自定义参数传递，满足多样化应用场景。
代码即学即用：所有代码片段均可直接复制运行，大幅降低学习门槛。

5.2 最佳实践建议

始终验证 base_url：每次重启实例后检查服务地址是否变化
合理设置 temperature：创意任务可设为 0.7~1.0，严谨任务建议 0.1~0.5
优先使用 stream 模式：提升用户交互体验，尤其适合网页前端集成
开启 reasoning 功能辅助调试：在开发阶段帮助理解模型决策路径

5.3 下一步学习方向

尝试将 Qwen3-1.7B 与 LangChain Agents 结合，构建自主决策的 AI 助手
接入外部工具（如搜索引擎、数据库）实现 RAG（检索增强生成）
对模型进行 LoRA 微调，适配特定业务场景
部署为 REST API 服务，供其他系统调用

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

Qwen3-1.7B保姆级教程：图文详解Jupyter与LangChain集成