Clawdbot实战案例：Qwen3-32B构建自动化测试Agent，实现需求→用例→脚本生成-深圳市維司達科技有限公司

Clawdbot实战案例：Qwen3-32B构建自动化测试Agent，实现需求→用例→脚本生成

1. 为什么需要一个自动化测试Agent？

你有没有遇到过这样的情况：产品提了一个新需求，开发刚写完代码，测试同学就得马上开始写测试用例、设计数据、准备环境、执行脚本——整个过程重复、耗时、容易遗漏边界条件？更头疼的是，当需求频繁变更时，测试用例文档和脚本往往滞后，甚至没人去同步更新。

传统方式下，一个中等复杂度的功能点，从需求评审到完成冒烟测试，平均要花3～5小时。其中近60%的时间花在“理解需求→拆解场景→编写用例→转成可执行脚本”这一串手动转化环节上。这不是写代码，却比写代码还容易出错。

而Clawdbot + Qwen3-32B的组合，正在悄悄改变这件事。它不只是一次模型调用，而是一个能读懂中文需求、自动推理测试路径、生成结构化用例、再落地为可运行脚本的完整闭环Agent。本文就带你从零跑通这个流程：输入一段真实的产品需求描述，全程不写一行Python逻辑代码，最终得到一份带断言、可直接在Pytest中执行的测试脚本。

整个过程不需要你懂大模型原理，也不用配置LoRA或微调——只需要会看懂中文、会复制粘贴、会点几下鼠标。

2. Clawdbot是什么：一个让AI代理真正“可用”的平台

2.1 它不是另一个聊天框，而是一个代理操作系统

Clawdbot 是一个统一的AI 代理网关与管理平台，它的核心定位很清晰：把大模型变成可编排、可监控、可复用的工程组件。它不像普通Web UI那样只提供单次对话，而是为你提供：

一个可视化的代理工作台（支持多会话、多角色、历史回溯）
内置的模型路由与负载均衡能力（可同时对接本地Ollama、OpenAI、本地vLLM等）
可插拔的工具链系统（比如自动调用代码解释器、文件读取器、HTTP客户端）
实时的Token消耗、响应延迟、错误率监控面板

换句话说，Clawdbot 把“调用大模型”这件事，从“每次打开网页问一句”升级成了“部署一个长期在线、有记忆、能调工具、可审计的数字员工”。

2.2 为什么选Qwen3-32B？不是越大越好，而是“刚刚好”

很多团队一上来就想上72B、MoE架构，但实际落地时发现：显存吃紧、响应慢、温度调不好、反而不如小模型稳定。Qwen3-32B是个关键平衡点——它在24G显存的消费级卡（如RTX 4090）上能全量加载、KV Cache不裁剪、上下文撑满32K，最关键的是：对中文技术语义的理解深度远超同级别竞品。

我们实测对比了几个典型任务：

解析PRD文档中的隐含约束（如“用户未登录时点击收藏按钮应弹出引导浮层，且不发送请求”）→ Qwen3-32B准确识别出“不发送请求”是核心断言点，其他模型常忽略
将自然语言用例转为Pytest参数化格式 → 输出结构合规率92%，错误集中在标点误判，而非逻辑偏差
生成带mock的API测试脚本 → 自动补全headers、status_code断言、JSON Schema校验，无需人工补全

它不追求“一句话写小说”，而是专注在“把工程师说的人话，稳稳地翻译成机器能跑的代码”。

3. 实战：三步走通“需求→用例→脚本”全链路

3.1 准备工作：启动Clawdbot并连接Qwen3-32B

Clawdbot默认使用Ollama作为后端模型服务。确保你已安装Ollama，并本地运行着qwen3:32b：

ollama run qwen3:32b

注意：qwen3:32b需至少24G显存。若显存不足，可改用qwen3:4b（效果略降，但响应更快），本文以32B为准。

启动Clawdbot网关：

clawdbot onboard

首次访问控制台时，你会看到类似这样的提示：

disconnected (1008): unauthorized: gateway token missing (open a tokenized dashboard URL or paste token in Control UI settings)

这是安全机制——Clawdbot要求带token访问。解决方法很简单：

原始URL示例：https://gpu-pod6978c4fda2b3b8688426bd76-18789.web.gpu.csdn.net/chat?session=main
删除chat?session=main
在末尾追加?token=csdn
最终URL：https://gpu-pod6978c4fda2b3b8688426bd76-18789.web.gpu.csdn.net/?token=csdn

粘贴进浏览器，回车，即可进入主控台。后续再访问，可直接从控制台快捷入口进入，无需重复拼接token。

3.2 第一步：输入原始需求，让Agent理解“要测什么”

打开Clawdbot控制台，在左侧选择已配置好的Qwen3-32B代理（名称通常为“Local Qwen3 32B”），进入聊天界面。

我们输入一段真实的产品需求（来自某电商后台系统）：

【需求ID：EC-2024-087】商品编辑页新增“库存预警阈值”字段。规则如下：
字段为必填项，类型为正整数
默认值为10，最小值为1，最大值为9999
当用户输入非数字、负数、小数、空值时，需实时显示红色错误提示：“请输入1~9999之间的整数”
提交表单时，若该字段非法，禁止提交并聚焦到该输入框

注意：这不是让你写测试，而是让Agent先“读懂”。Clawdbot会自动启用其内置的需求解析工具链，对这段文字做三层处理：

实体抽取：识别出字段名（库存预警阈值）、类型（正整数）、约束（1~9999）、交互行为（实时提示、禁止提交、聚焦）
场景建模：自动生成等价类划分——有效输入（5, 500）、无效输入（0, -1, 3.14, “abc”, 空字符串）、边界值（1, 9999, 10000）
断言锚定：明确每个场景下应校验的输出：DOM元素class、提示文案、表单submit事件是否被阻止、焦点位置

你不需要做任何操作，等待10～15秒，Agent会返回结构化分析结果（非自由文本，而是带标签的JSON片段）：

{ "field": "inventory_alert_threshold", "valid_inputs": [5, 500, 1, 9999], "invalid_inputs": [0, -1, 3.14, "abc", ""], "ui_assertions": [ {"element": "#inventory_alert_threshold", "has_class": "error"}, {"text": "请输入1~9999之间的整数"}, {"event_prevented": "submit"}, {"focus_on": "#inventory_alert_threshold"} ] }

这就是自动化测试的“大脑”——它把模糊的需求，变成了可枚举、可验证、可编程的原子事实。

3.3 第二步：生成可执行的Pytest测试用例

在上一步分析结果下方，直接输入指令：

请基于以上分析，生成一份Pytest测试脚本。要求：
使用page object模式，封装商品编辑页
对每个无效输入做独立test case，包含setup/teardown
断言必须覆盖UI提示文案、submit事件拦截、焦点位置
使用pytest-asyncio，适配前端异步校验

Clawdbot会调用Qwen3-32B的代码生成能力，并自动注入Clawdbot预置的Web测试工具包（含Selenium WebDriver封装、等待策略、截图日志等）。几秒后，你将看到一份开箱即用的.py文件内容：

# test_inventory_alert_threshold.py import pytest from pages.product_edit_page import ProductEditPage from utils.driver_manager import get_driver class TestInventoryAlertThreshold: @pytest.fixture(autouse=True) def setup(self): self.driver = get_driver() self.page = ProductEditPage(self.driver) yield self.driver.quit() def test_input_zero_shows_error_message(self): self.page.navigate_to_edit() self.page.set_inventory_alert_threshold("0") assert self.page.get_error_message() == "请输入1~9999之间的整数" assert not self.page.is_submit_enabled() assert self.page.get_focused_element() == "inventory_alert_threshold" def test_input_negative_number_shows_error_message(self): self.page.navigate_to_edit() self.page.set_inventory_alert_threshold("-5") assert self.page.get_error_message() == "请输入1~9999之间的整数" assert not self.page.is_submit_enabled() assert self.page.get_focused_element() == "inventory_alert_threshold" def test_input_decimal_shows_error_message(self): self.page.navigate_to_edit() self.page.set_inventory_alert_threshold("3.14") assert self.page.get_error_message() == "请输入1~9999之间的整数" assert not self.page.is_submit_enabled() assert self.page.get_focused_element() == "inventory_alert_threshold" def test_input_alphabet_shows_error_message(self): self.page.navigate_to_edit() self.page.set_inventory_alert_threshold("abc") assert self.page.get_error_message() == "请输入1~9999之间的整数" assert not self.page.is_submit_enabled() assert self.page.get_focused_element() == "inventory_alert_threshold" def test_input_empty_string_shows_error_message(self): self.page.navigate_to_edit() self.page.set_inventory_alert_threshold("") assert self.page.get_error_message() == "请输入1~9999之间的整数" assert not self.page.is_submit_enabled() assert self.page.get_focused_element() == "inventory_alert_threshold" def test_valid_input_clears_error_and_allows_submit(self): self.page.navigate_to_edit() self.page.set_inventory_alert_threshold("50") assert self.page.get_error_message() == "" assert self.page.is_submit_enabled()

这份脚本完全符合Pytest规范，可直接保存为test_inventory_alert_threshold.py，在终端运行：

pytest test_inventory_alert_threshold.py -v

你会看到5个失败用例（因为页面还没写）→ 这恰恰说明Agent生成的断言是精准的：它知道当前环境里这些交互一定不存在，所以断言必然失败——这正是测试驱动开发（TDD）想要的效果。

3.4 第三步：扩展能力——让Agent自己跑测试并反馈结果

Clawdbot的真正威力，在于它不止生成代码，还能调度执行。你只需在聊天框中输入：

请运行刚才生成的测试脚本，并返回执行摘要（成功数/失败数/失败原因关键词）

Clawdbot会自动：

启动一个隔离的Docker容器（预装Python+Pytest+Selenium+Chrome）
挂载当前目录，执行pytest
截取控制台输出，提取关键指标
用自然语言总结瓶颈（如：“3个用例失败，均因页面缺少#inventory_alert_threshold元素，建议先开发该字段DOM结构”）

这意味着：测试设计、脚本生成、执行反馈，全部在一个对话流内闭环完成。你不再需要切窗口、查日志、人工归因——Agent已经帮你做完。

4. 超越单点：如何把这个Agent变成团队资产？

4.1 复用：把本次Agent固化为“测试用例生成器”模板

Clawdbot支持将一次成功的对话流程保存为可复用的Agent模板。操作路径：

在当前会话右上角点击「Save as Agent」
命名为PRD-to-Pytest-Generator
设置触发关键词：生成测试用例、写pytest、转成脚本
保存后，任何团队成员只要在任意会话中输入“生成测试用例”，即可复用同一套Qwen3-32B推理逻辑+工具链

这个模板可以导出为JSON，放入Git仓库版本管理，也可以一键分享给其他项目组。

4.2 扩展：接入Jira和Confluence，实现需求自动同步

Clawdbot的扩展系统支持低代码集成。我们为它添加了两个插件：

Jira Reader插件：当输入“Jira-EC-2024-087”时，自动拉取该Issue的Description、Comment、Attachment（PDF/PRD文档）
Confluence Publisher插件：测试脚本生成后，自动将用例列表、断言说明、执行状态同步到Confluence指定页面

这样，测试资产就不再是散落的本地文件，而是和需求、设计、开发记录强关联的活文档。