news 2026/4/23 19:15:33

【pytorch】transform的使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【pytorch】transform的使用

一、transforms的用法

transforms​ 是数据预处理与增强的核心工具,主要用于将原始图像转换为模型可接受的格式,并通过随机变换丰富数据集以提高模型泛化能力。
导入方式:

fromtorchvisionimporttransforms

主要用法,按顺序

transform_pipeline=transforms.Compose([transforms.Resize(256),# 调整图像大小至256x256(保持宽高比)transforms.CenterCrop(224),# 从中心裁剪224x224区域(常用预训练模型输入尺寸)transforms.RandomHorizontalFlip(p=0.5),# 以50%概率水平翻转(数据增强)transforms.ToTensor(),# 将PIL图像转换为Tensor(像素值缩放至[0,1])transforms.Normalize(# 标准化(使用ImageNet均值/方差)mean=[0.485,0.456,0.406],# RGB通道均值std=[0.229,0.224,0.225]# RGB通道标准差)])

二、transform的使用

将PIL图像转换成Tensor类型

fromPILimportImagefromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)print(tensor_img.shape)#CHW


通过tensor()类型的数据生成tensorboard图

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')writer.add_image('tensor_img',tensor_img,0)writer.close()


Normalize()归一化使用

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')norm_trans=transforms.Normalize([0.485,0.456,0.406],[0.5,0.5,0.5])norm_img=norm_trans(tensor_img)writer.add_image('tensor_img',tensor_img,0)writer.add_image('norm_img',norm_img,1)writer.close()

归一化后的图片和未归一化的图片

Resize()调整大小的使用

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')norm_trans=transforms.Normalize([0.485,0.456,0.406],[0.5,0.5,0.5])norm_img=norm_trans(tensor_img)# print(img.size)resize_trans=transforms.Resize((256,256))resize_img=resize_trans(tensor_img)writer.add_image('resize_img',resize_img,0)# print(resize_img.size)#Compose用法trans_resize_2=transforms.Compose([transforms.Resize((512)),transforms.ToTensor()])img_resize_2=trans_resize_2(img)writer.add_image('tensor_img',tensor_img,0)writer.add_image('norm_img',norm_img,1)writer.add_image('img_resize_2',img_resize_2,2)writer.close()

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 13:19:49

MicroPython-adf固件编译

Ubuntu系统版本信息:lsb_release -aDistributor ID: Ubuntu Description: Ubuntu 24.04.3 LTS Release: 24.041. 安装依赖sudo apt install git python3.10-venv cmake make gcc2. 安装 Micropython (1) 下载micropythongit clone https://github.com/mic…

作者头像 李华
网站建设 2026/4/22 14:57:14

3步搞定DuckDB Java连接:从零到一的实战指南

3步搞定DuckDB Java连接:从零到一的实战指南 【免费下载链接】duckdb DuckDB is an in-process SQL OLAP Database Management System 项目地址: https://gitcode.com/GitHub_Trending/du/duckdb DuckDB作为嵌入式OLAP数据库的明星产品,其Java连接…

作者头像 李华
网站建设 2026/4/23 12:25:11

EmotiVoice情感分类模型训练过程全公开

EmotiVoice情感分类模型训练过程全公开 在虚拟助手开始对你“冷笑”、游戏NPC因剧情转折而声音颤抖的今天,语音合成早已不再是简单的文字朗读。人们期待的不再是一段清晰但冰冷的语音输出,而是一个能感知情绪、表达情感、甚至带有“人格”的声音伙伴。正…

作者头像 李华
网站建设 2026/4/23 12:25:14

2025全新方案:5步构建高性能现代化Web架构实战指南

2025全新方案:5步构建高性能现代化Web架构实战指南 【免费下载链接】strapi 🚀 Strapi is the leading open-source headless CMS. It’s 100% JavaScript/TypeScript, fully customizable and developer-first. 项目地址: https://gitcode.com/GitHub…

作者头像 李华
网站建设 2026/4/23 12:25:33

10分钟掌握Lime编辑器:从零到精通的完整指南

还在为寻找完美的开源代码编辑器而纠结吗?作为Sublime Text的完美开源替代品,Lime编辑器凭借其API兼容性和强大扩展性,正在成为开发者们的新宠。无论你是编程新手还是资深开发者,这篇指南都能让你在10分钟内彻底掌握Lime编辑器&am…

作者头像 李华
网站建设 2026/4/23 12:24:21

高校科研单位使用EmotiVoice可申请优惠

高校科研单位使用 EmotiVoice 可申请优惠 在心理学实验室里,研究人员正试图验证一个假设:不同情绪语调的安慰话语,是否会影响受试者的共情反应。过去,他们需要招募多名配音演员,在录音棚中反复录制同一句话的不同版本—…

作者头像 李华