news 2026/4/23 14:15:11

AI模型训练:数据获取与增强

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI模型训练:数据获取与增强

数据是训练一切模型的基础,因此如何获取数据就成了一个先行条件。

1.常见的机器学习数据集

(1)MNIST

属于计算机视觉领域,手写数字灰度图,包含有六万的训练集以及一万的测试集。

(2)ImageNet

引领了深度学习的热点,它包含1400万+的标注图像,2万多的类别。

(3)AudioSet

基于 YouTube 上声音的切片,用于进行声音分类。

(4)KITTI

基于驾驶的信息用作无人驾驶训练。

(5)LibriSpeech

有声读物训练集,基于 LibriVox 项目的公共领域英语有声读物构建,用于自动语音识别。

(6)Object Detection Datasets

用于目标检测的数据集,包含车辆、人脸、火灾、危险行为等。https://public.roboflow.com/object-detection

2.生成数据集

(1)使用 GAN s

https://this-person-does-not-exist.com/en

(2)数据增强

通过对原始训练数据进行一系列随机但有意义的变换,生成新的、多样化的训练样本的技术。例如旋转、缩放、噪音、抖动等技术增加数据的多样性和数量,让模型看到更多可能的“变体”,从而提高模型的泛化能力鲁棒性

# 定义多种增强变换 def create_augmentation_transforms(): transforms_list = { # 基础几何变换 'Original': transforms.Compose([ transforms.Resize((256, 256)), ]), # 各种旋转 'Rotate 30°': transforms.Compose([ transforms.Resize((256, 256)), transforms.RandomRotation(30), ]), 'Rotate 45°': transforms.Compose([ transforms.Resize((256, 256)), transforms.RandomRotation(45), ]), 'Rotate -15°': transforms.Compose([ transforms.Resize((256, 256)), lambda x: F.rotate(x, -15), # 固定角度旋转 ]), # 缩放和裁剪 'Random Resized Crop': transforms.Compose([ transforms.RandomResizedCrop( size=256, scale=(0.5, 1.0), # 随机缩放50%-100% ratio=(0.75, 1.33) # 宽高比范围 ), ]), # 翻转 'Horizontal Flip': transforms.Compose([ transforms.Resize((256, 256)), transforms.RandomHorizontalFlip(p=1.0), # 强制翻转 ]), 'Vertical Flip': transforms.Compose([ transforms.Resize((256, 256)), transforms.RandomVerticalFlip(p=1.0), ]), # 颜色变换 'Color Jitter (Strong)': transforms.Compose([ transforms.Resize((256, 256)), transforms.ColorJitter( brightness=0.5, contrast=0.5, saturation=0.5, hue=0.3 ), ]), 'Grayscale': transforms.Compose([ transforms.Resize((256, 256)), transforms.Grayscale(num_output_channels=3), # 保持3通道 ]), # 噪声 'Gaussian Noise': transforms.Compose([ transforms.Resize((256, 256)), AddNoise(noise_type='gaussian', intensity=0.2), ]), 'Salt & Pepper Noise': transforms.Compose([ transforms.Resize((256, 256)), AddNoise(noise_type='salt_pepper', intensity=0.05), ]), # 模糊效果 'Gaussian Blur': transforms.Compose([ transforms.Resize((256, 256)), transforms.GaussianBlur(kernel_size=5, sigma=(0.1, 2.0)), ]), # 透视变换 'Perspective Transform': transforms.Compose([ transforms.Resize((256, 256)), transforms.RandomPerspective( distortion_scale=0.5, p=1.0 ), ]), # 仿射变换 'Affine Transform': transforms.Compose([ transforms.Resize((256, 256)), transforms.RandomAffine( degrees=0, translate=(0.2, 0.2), # 平移20% scale=(0.8, 1.2), # 缩放80%-120% shear=20 # 错切20度 ), ]), # 弹性变换 'Elastic Transform': transforms.Compose([ transforms.Resize((256, 256)), transforms.ElasticTransform(alpha=50.0, sigma=5.0), ]), # 组合增强(随机顺序) 'Random Combination': transforms.Compose([ transforms.Resize((256, 256)), transforms.RandomApply([ transforms.RandomRotation(20), transforms.ColorJitter(0.3, 0.3, 0.3, 0.1), ], p=0.8), transforms.RandomHorizontalFlip(p=0.5), transforms.RandomGrayscale(p=0.2), ]), # 边缘增强 'Sharpness Adjust': transforms.Compose([ transforms.Resize((256, 256)), transforms.RandomAdjustSharpness(sharpness_factor=2, p=1.0), ]), # 自动对比度 'Auto Contrast': transforms.Compose([ transforms.Resize((256, 256)), transforms.RandomAutocontrast(p=1.0), ]), }

文本增强:将一段话翻译为另一种中间语言,然后又翻译回该语言以此实现语义相同但是语法结构不同的效果。此外还有多种方式,比如词汇级增强(同义词替换、随机插入)字符级增强(随机字符替换、随机字符交换等)句子级增强(语法树变换等)。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 17:18:20

芒格的“锚定效应“警示:避免固有思维陷阱

芒格的"锚定效应"警示:避免固有思维陷阱 关键词:锚定效应、固有思维陷阱、认知偏差、决策影响、避免方法 摘要:本文围绕芒格所提及的“锚定效应”展开,深入剖析其原理、影响及如何避免陷入固有思维陷阱。详细介绍了锚定…

作者头像 李华
网站建设 2026/4/23 10:37:49

2026新版Python3.14.2安装全攻略

好的,这是针对2026最新版Python 3.14.2的安装与使用指南:Python 3.14.2 安装使用指南一、安装步骤访问官网打开浏览器,访问官方下载页面:https://www.python.org/downloads/选择安装包根据操作系统选择对应版本:Window…

作者头像 李华
网站建设 2026/4/22 14:27:41

永磁同步电机(PMSM)的PI控制

目录 一、PID各项的作用 (1)比例(P) (2)积分(I) (3)微分(D) 二、实际应用中的常见组合 三、永磁同步电机(PMSM&…

作者头像 李华
网站建设 2026/4/23 10:48:58

【课程设计/毕业设计】基于微信小程序的高校班务管理系统基于小程序的高校班级管理系统设计与实现【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/16 15:01:57

【AI智能体】03-AI Agent架构与组件:解析AI Agent的组成部分及其工作流程

引言AI Agent架构与组件是现代人工智能领域中的一个核心概念,它涉及对智能代理(AI Agent)的内部结构和功能模块的系统性解析。AI Agent作为一种能够感知环境、做出决策并执行行动的自主实体,其设计和实现依赖于复杂的架构和多种组…

作者头像 李华