news 2026/4/23 9:41:52

中医药 AI 智能识别 中药材自动化分拣 建立基于深度学习YOLOV8中药检测系统 白茯苓 白芍 白术 栀子 甘草 当归 黄精 冬虫夏草 黄精 肉桂

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
中医药 AI 智能识别 中药材自动化分拣 建立基于深度学习YOLOV8中药检测系统 白茯苓 白芍 白术 栀子 甘草 当归 黄精 冬虫夏草 黄精 肉桂

医学中医-中草药检测数据集
45种中草药图集已标注,YOLO格式

训练集:8500张
验证集:1500张
每种中药有1000张图片


1

1


🌿 中草药检测数据集(YOLO格式)

总类别数:45 种
总图像数量:10,000 张
标注框总数:16,754 个
标签格式:YOLO(.txt)
文件格式:JPG / PNG

项目内容说明
数据集名称中草药检测数据集(45类)
类别数量45 类
总图像数量10,000 张
标注框总数16,754 个(平均每个图像约 1.68 个目标)
数据划分
– 训练集8,500 张
– 验证集1,500 张
每类样本数量原始设计为“每种中药有 1000 张”,但实际统计显示部分类别不足(如人参仅90张)
标注方式手动标注(使用 LabelImg 或类似工具),边界框(Bounding Box)
标签格式✅ YOLO 格式.txt文件:
class_id x_center y_center width height(归一化坐标)
• 支持直接用于 YOLOv5/v8 等模型训练
图像格式JPG / PNG(高清扫描图或实物拍摄)
图像分辨率多样化(常见 800×600 至 2048×1536,取决于拍摄设备)
背景复杂度包含纯白背景、木质桌面、药材堆叠等场景,适合真实应用
典型应用场景• 中药材智能识别
• 药材质量分级
• 中医AI辅助诊断系统
• 自动化分拣机器人

📊 类别统计表(前45类)

类别ID类别名称图片数量标注数量
0白茯苓309555
1白芍356860
2白术452853
3蒲公英177177
4甘草3941026
5栀子190190
6党参340522
7桃仁96172
8去皮桃仁164164
9地肤子280280
10牡丹皮5178
11冬虫夏草359675
12杜仲106112
13当归518925
14杏仁179180
15何首乌267598
16黄精298499
17鸡血藤146146
18枸杞477807
19莲须292341
20莲肉415613
21麦门冬141176
22木通201201
23玉竹228833
24女贞子258286
25肉苁蓉203271
26人参90108
27乌梅191191
28覆盆子167167
29瓜蒌皮164164
30肉桂330431
31山茱萸212212
32山药8686
33酸枣仁276298
34桑白皮122122
35山楂310474
36天麻9797
37熟地黄407508
38小茴香165165
39泽泻126186
40竹茹121130
41川贝母133228
42川芎5611173
43玄参149149
44益智仁265325
总计-10,00016,754

⚠️备注

  • 总图片数为 10,000 张,但部分类别远少于 1000 张(如“人参”仅90张,“山药”86张),可能为标注未完成或采样不均;
  • “川芎”类别标注最多(1173个),可能是多粒密集分布;
  • “蒲公英”和“鸡血藤”等类别标注数量等于图片数,说明每图仅一个目标。

📁 数据目录结构示例

herbal_dataset/ ├── images/ │ ├── train/ # 8500 张 │ ├── val/ # 1500 张 │ └── test/ # (可选) └── labels/ ├── train/ # 对应 .txt 文件 └── val/

✅ 支持的模型任务

任务类型是否支持说明
目标检测(YOLO)使用 YOLOv5/v8 可直接训练
分类任务可提取特征用于分类器
实例分割(Mask)无 mask 标注
多标签识别单目标为主

🛠️ 推荐训练方案(YOLOv8)

1. 创建data.yaml
# data.yamlpath:./herbal_datasettrain:images/trainval:images/valnc:45names:['白茯苓','白芍','白术','蒲公英','甘草','栀子','党参','桃仁','去皮桃仁','地肤子','牡丹皮','冬虫夏草','杜仲','当归','杏仁','何首乌','黄精','鸡血藤','枸杞','莲须','莲肉','麦门冬','木通','玉竹','女贞子','肉苁蓉','人参','乌梅','覆盆子','瓜蒌皮','肉桂','山茱萸','山药','酸枣仁','桑白皮','山楂','天麻','熟地黄','小茴香','泽泻','竹茹','川贝母','川芎','玄参','益智仁']
2. 训练代码(train.py
fromultralyticsimportYOLO model=YOLO('yolov8n.pt')# 或 yolov8s.ptresults=model.train(data='data.yaml',epochs=100,imgsz=640,batch=16,name='herbal_detection',device=0,patience=20,hsv_h=0.01,hsv_s=0.5,hsv_v=0.3,degrees=10.0)

🌱总结:该数据集是中医药 AI 智能识别的宝贵资源,适用于中药材自动化分拣、质量控制、中医教学系统等场景。尽管部分类别样本偏少,但整体覆盖广泛,适合构建高性能目标检测模型。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 18:34:16

48小时挑战:用ANYROUTER快速验证网络创新idea

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个ANYROUTER快速原型开发框架,包含:1)模块化路由组件库 2)可视化拓扑编辑器 3)一键仿真测试环境 4)性能分析工具。支持用户通过拖拽方式组合路由功能…

作者头像 李华
网站建设 2026/4/23 8:51:44

Python注释工具对比:快马AI vs 传统方法

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 请为以下Python类生成完整注释,首先用传统方法手动编写注释,然后使用AI自动生成。比较两者差异:class DataProcessor:def __init__(self, sourc…

作者头像 李华
网站建设 2026/4/23 10:07:18

企业级实战:Jumpserver在多云环境中的部署方案

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 设计一个支持多云管理的Jumpserver部署方案,要求:1. 兼容AWS、阿里云、腾讯云平台 2. 实现统一身份认证 3. 包含跨云会话审计功能 4. 提供资产自动发现模块…

作者头像 李华
网站建设 2026/4/23 10:09:54

Qwen3-VL时尚推荐:视觉搜索优化方案

Qwen3-VL时尚推荐:视觉搜索优化方案 1. 引言:从视觉理解到个性化推荐的跃迁 在电商、社交和内容平台中,“以图搜图” 已成为用户表达审美偏好的核心交互方式。然而,传统基于CNN或CLIP的视觉搜索系统普遍存在语义鸿沟——能识别颜…

作者头像 李华
网站建设 2026/4/23 10:11:09

Qwen3-VL-WEBUI保险定损:事故图像智能评估实战

Qwen3-VL-WEBUI保险定损:事故图像智能评估实战 1. 引言:AI如何重塑保险定损流程 在传统车险理赔中,事故车辆的定损依赖人工勘察、经验判断和纸质记录,流程耗时长、成本高且易受主观因素影响。随着多模态大模型技术的发展&#x…

作者头像 李华
网站建设 2026/4/23 10:09:38

Qwen3-VL地质勘探:岩石识别技术

Qwen3-VL地质勘探:岩石识别技术 1. 引言:AI视觉语言模型在地质勘探中的新突破 随着人工智能技术的不断演进,多模态大模型正逐步渗透到传统工业与科研领域。在地质勘探中,岩石识别作为基础且关键的一环,长期依赖专家经…

作者头像 李华