news 2026/4/23 12:11:57

原始数据—>张量转换后会丢失原始数据吗

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
原始数据—>张量转换后会丢失原始数据吗

学习李沐香蕉目标检测时疑问

原始数据 → 张量的转换链路(全程可回溯):

1. 图像原始数据的转换链路
硬盘上的.png文件(原始数据) ↓ 由torchvision.io.read_image读取 单个图像张量(uint8,[C,H,W])→ 存入images列表 ↓ 在BananasDataset的__getitem__中 转为float32张量(模型可训练)

张量和原始图片是一一对应的数值映射

比如原始图片中 (100,200) 像素的 RGB 值是 (255,0,0),张量中img[0,100,200]=255(R 通道)、img[1,100,200]=0(G 通道)、img[2,100,200]=0(B 通道)。

若要还原为 “可视化的原始图片”,只需将张量转格式即可:

# 从images列表中取第一个图像张量(还原原始图片) img_tensor = train_dataset.features[0] # uint8张量,[3,H,W] # 步骤1:转置为[H,W,C](Matplotlib可视化格式) img_np = img_tensor.permute(1,2,0).numpy() # 步骤2:显示原始图片(和硬盘上的.png文件完全一致) d2l.plt.imshow(img_np)
2. 标签原始数据的转换链路
CSV文本文件(原始标注:img_name,label,xmin,ymin,xmax,ymax) ↓ 由pd.read_csv读取为DataFrame(文本→数字) ↓ 转为list(target)([0,100,80,200,180]) ↓ torch.tensor(targets).unsqueeze(1) 标签张量(float32,[N,1,5])

张量中的数值就是 CSV 里的原始数字(只是维度适配),比如张量labels[0] = [[0,100,80,200,180]],对应 CSV 中00001.png的标注:label=0, xmin=100, ymin=80, xmax=200, ymax=180

若要还原为 “原始 CSV 格式”,只需将张量转回 DataFrame:

# 从标签张量还原原始标注 labels_np = train_dataset.labels.squeeze(1).numpy() # [N,5] csv_raw = pd.DataFrame( labels_np, columns=['label','xmin','ymin','xmax','ymax'] ) # 添加img_name列(从CSV中读取的原始图像名) csv_raw['img_name'] = csv_data.index print(csv_raw) # 和原始CSV文件内容完全一致

为什么代码不返回 “原始数据”(文件 / 文本)?

PyTorch 模型训练的核心是数值计算,原始的.png 文件(二进制)、CSV 文本(字符串)无法直接输入模型 —— 必须转为张量(数值矩阵):

  1. 图像张量:是原始图片像素的数值化表示,可参与梯度计算、卷积等操作;
  2. 标签张量:是原始标注的数值化表示,可用于计算损失(如边界框回归损失)。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 10:13:38

年薪15-30万很普遍?女生更受青睐?零基础转行网络安全的黄金期到了!

数字化浪潮席卷全球,云计算、物联网、大数据、人工智能等技术深度融入生产生活的方方面面。 与此同时,网络攻击事件频发,数据泄露、勒索病毒、系统瘫痪等安全威胁日益严峻,对国家安全、企业运营和个人隐私构成巨大挑战。 在此背…

作者头像 李华
网站建设 2026/4/23 11:40:37

ACE-Step:开源AI音乐生成模型快速上手

ACE-Step:开源AI音乐生成模型快速上手 政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 希望政安晨的博客能够对您有所裨益,如有不足之处,欢迎在评论区提出指正! 你有没有想过,有一天只需输…

作者头像 李华
网站建设 2026/4/23 11:40:39

多模态向量检索技术深度解析:从理论突破到产业实践

多模态向量检索技术深度解析:从理论突破到产业实践 【免费下载链接】qdrant Qdrant - 针对下一代人工智能的高性能、大规模向量数据库。同时提供云端版本 项目地址: https://gitcode.com/GitHub_Trending/qd/qdrant 在人工智能技术快速发展的当下&#xff0c…

作者头像 李华
网站建设 2026/4/23 11:40:17

JVM面试篇总结

一、JVM基础概念 1.1 JVM定义与作用 定义:Java虚拟机(Java Virtual Machine)本质上是一个运行在计算机上的程序,负责运行Java字节码文件跨平台特性:支持"Write Once, Run Anywhere"理念,将Java源代码编译成字节码后&…

作者头像 李华
网站建设 2026/4/23 11:40:19

YOLO11-AIFI重型设备检测与识别--建筑工地十类设备自动定位_1

20230701_HeavyEquipment 数据集是一个专为计算机视觉应用设计的建筑工地重型设备检测数据集,该数据集采用 CC BY 4.0 许可证,由 qunshankj 平台用户贡献并提供。数据集包含 3962 张建筑工地场景图像,其中部分图像已采用 YOLOv8 格式进行标注…

作者头像 李华
网站建设 2026/4/23 11:40:18

农业大棚材质识别与分类全流程:从数据采集到模型部署的实战指南

1. 农业大棚材质识别与分类全流程:从数据采集到模型部署的实战指南 在现代农业发展中,农业大棚的材质识别与分类对于提高农业生产效率、优化资源配置具有重要意义。本文将详细介绍从数据采集到模型部署的完整流程,帮助读者构建一个实用的农业…

作者头像 李华