news 2026/4/23 15:56:38

无人机拍摄沙滩垃圾分类识别数据集1148张VOC+YOLO格式

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
无人机拍摄沙滩垃圾分类识别数据集1148张VOC+YOLO格式

无人机拍摄沙滩垃圾分类识别数据集1148张VOC+YOLO格式

数据集格式:VOC格式+YOLO格式

压缩包内含:3个文件夹,分别存储图片、xml、txt文件

JPEGImages文件夹中jpg图片总计:1148

Annotations文件夹中xml文件总计:1148

labels文件夹中txt文件总计:1148

标签种类数:6

标签名称:["glass","plastic-bottle","retort-pouch","take-away-containers","takeaway-cup","tin-and-aluminum-cans"]

中文标签对照:“玻璃”、“塑料瓶”、“杀菌袋”、“外卖盒”、“外卖杯”、“铁罐和铝罐”

每个标签的框数(注意yolo格式类别顺序不和这个对应,而以labels文件夹classes.txt为准):

glass 框数 = 1183

plastic-bottle 框数 = 2118

retort-pouch 框数 = 1733

take-away-containers 框数 = 861

takeaway-cup 框数 = 1436

tin-and-aluminum-cans 框数 = 2500

总框数:9831

图片清晰度(分辨率:像素):清晰

图片是否增强:否

github仓库位置:datasets_sl

标签形状:矩形框,用于目标检测识别

重要说明:暂无

特别声明:本数据集不对训练的模型或者权重文件精度作任何保证,数据集只提供准确且合理标注

标注及图片情况如下:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 14:26:48

AnimeGANv2部署优化:自动化批量处理的脚本编写

AnimeGANv2部署优化:自动化批量处理的脚本编写 1. 背景与需求分析 随着AI图像风格迁移技术的成熟,AnimeGANv2 因其轻量高效、画风唯美的特点,广泛应用于照片动漫化场景。尽管其WebUI版本在交互体验上表现良好,适合单张图片处理&…

作者头像 李华
网站建设 2026/4/23 13:55:56

VibeVoice-TTS文档解读:官方API调用部署示例

VibeVoice-TTS文档解读:官方API调用部署示例 1. 背景与技术定位 随着生成式AI在语音领域的深入发展,传统文本转语音(TTS)系统在长文本合成、多说话人对话连贯性以及语义表现力方面逐渐暴露出局限。尤其是在播客、有声书、虚拟角…

作者头像 李华
网站建设 2026/4/23 14:27:59

Keil5使用教程:图解说明如何使用串口打印日志

Keil5实战指南:手把手教你用串口打印调试日志从“灯闪了没”到“日志说了啥”——嵌入式调试的进化之路你还记得第一次点亮LED时的心情吗?那盏小小的灯,承载着无数嵌入式工程师的入门记忆。但很快我们就会发现,光靠“灯闪不闪”、…

作者头像 李华
网站建设 2026/4/18 13:28:05

通义千问2.5-7B-Instruct效果惊艳!表情识别案例展示

通义千问2.5-7B-Instruct效果惊艳!表情识别案例展示 近年来,大模型在多模态任务中的表现日益突出,尤其是在图像理解与语义推理结合的场景中展现出巨大潜力。本文将围绕通义千问2.5-7B-Instruct这一中等体量、全能型指令微调模型,…

作者头像 李华
网站建设 2026/4/23 15:33:52

AI Agent:从“被动大脑”到“主动同事”的进化之路

引子:当ChatGPT学会“动起来”想象这样一个场景:你告诉ChatGPT:“我想庆祝结婚纪念日,需要一家浪漫的餐厅,要有小提琴演奏,能看到城市夜景,人均预算2000元左右,最好能帮我预订并提醒…

作者头像 李华
网站建设 2026/4/23 15:28:22

STM32最小系统开发:keil5编译器5.06下载项目应用

从零搭建STM32开发环境:Keil5编译器5.06实战配置与最小系统深度解析 你有没有遇到过这样的情况?刚买回来的STM32“蓝 pill”开发板插上电脑,打开Keil却编译报错、下载失败,甚至MCU压根不运行。别急——这并不是硬件坏了&#xff0…

作者头像 李华