news 2026/4/23 14:04:13

day39图像数据与显存

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
day39图像数据与显存

一、 图像数据的介绍

1.1 灰度图像

从这里开始我们进入到了图像数据相关的部分,也是默认你有之前复试班计算机视觉相关的知识,但是一些基础的概念我仍然会提。

昨天我们介绍了minist这个经典的手写数据集,作为图像数据,相较于结构化数据(表格数据)他的特点在于他每个样本的的形状并不是(特征数,),而是(宽,高,通道数)

上述是昨天的代码,我们介绍了图像数据的预处理,这是我们首次接触图像数据,他和之前的结构化数据有什么差异点呢?

结构化数据(如表格)的形状通常是 (样本数, 特征数),例如 (1000, 5) 表示 1000 个样本,每个样本有 5 个特征。图像数据的形状更复杂,需要保留空间信息(高度、宽度、通道),因此不能直接用一维向量表示。其中颜色信息往往是最开始输入数据的通道的含义,因为每个颜色可以用红绿蓝三原色表示,因此一般输入数据的通道数是 3。

1.2 彩色图像

在 PyTorch 中,图像数据的形状通常遵循 (通道数, 高度, 宽度) 的格式(即 Channel First 格式),这与常见的 (高度, 宽度, 通道数)(Channel Last,如 NumPy 数组)不同。---注意顺序关系,

注意点:

  1. 如果用matplotlib库来画图,需要转换下顺序,我们后续介绍
  2. 模型输入通常需要 批次维度(Batch Size),形状变为 (批次大小, 通道数, 高度, 宽度)。例如,批量输入 10 张 MNIST 图像时,形状为 (10, 1, 28, 28)。

    二、 图像相关的神经网络的定义

    考虑课程内容的推进,今日的内容只提定义,不涉及训练和测试过程

    2.1 黑白图像模型的定义

  3. 实际定义中,输入图像还存在batchsize这一维度

    在 PyTorch 中,模型定义和输入尺寸的指定不依赖于 batch_size,无论设置多大的 batch_size,模型结构和输入尺寸的写法都是不变的。

  4. 三、显存占用的主要组成部分

    昨天说到了在面对数据集过大的情况下,由于无法一次性将数据全部加入到显存中,所以采取了分批次加载这种方式。即一次只加载一部分数据,保证在显存的范围内。

    那么显存设置多少合适呢?如果设置的太小,那么每个batchsize的训练不足以发挥显卡的能力,浪费计算资源;如果设置的太大,会出现OOT(out of memory)

    显存一般被以下内容占用:

  5. 模型参数与梯度:模型的权重(Parameters)和对应的梯度(Gradients)会占用显存,尤其是深度神经网络(如 Transformer、ResNet 等),一个 1 亿参数的模型(如 BERT-base),单精度(float32)参数占用约 400MB(1e8×4Byte),加上梯度则翻倍至 800MB(每个权重参数都有其对应的梯度)。

  6. 部分优化器(如 Adam)会为每个参数存储动量(Momentum)和平方梯度(Square Gradient),进一步增加显存占用(通常为参数大小的 2-3 倍)

  7. 其他开销。@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/11 0:32:21

深海探测作业:潜水员语音信息可靠传输与识别

深海探测作业中的语音通信革命:基于 Fun-ASR 的可靠识别实践 在深海300米的幽暗环境中,一名潜水员正通过水下通信系统向水面指挥中心报告:“氧气压力降至18兆帕,请求上浮。”然而,由于水流噪声和信号衰减,这…

作者头像 李华
网站建设 2026/4/23 9:50:07

为什么越来越多开发者选择IndexTTS 2.0做语音项目?

为什么越来越多开发者选择IndexTTS 2.0做语音项目? 在短视频每秒都在争夺注意力的今天,一段精准卡点、情绪饱满、声线统一的配音,往往决定了内容能否“爆”。然而现实是:专业配音成本高、档期难排;AI合成又常出现“音画…

作者头像 李华
网站建设 2026/4/23 9:49:21

JScope在工业HMI中的集成实践案例

JScope如何让工业HMI“看见”电机的每一次心跳?你有没有遇到过这样的场景:生产线上的机器人突然抖了一下,产品良率莫名下降,但PLC报警日志干干净净?操作员一脸茫然,维修工程师拿着万用表来回测电压&#xf…

作者头像 李华
网站建设 2026/4/23 9:49:29

睡眠监测设备:夜间打鼾声音分析评估呼吸暂停风险

睡眠监测设备:夜间打鼾声音分析评估呼吸暂停风险 在城市生活节奏日益加快的今天,越来越多的人开始关注自己的睡眠质量。而“打呼噜”早已不再是单纯的睡眠噪音——它可能是隐藏在夜间的健康警报。医学研究表明,频繁且伴随呼吸中断的打鼾&…

作者头像 李华
网站建设 2026/4/23 9:50:15

工业控制中三极管工作状态切换机制:操作指南

三极管开关控制的工程艺术:如何让工业电路稳定又高效?在工厂自动化系统中,一个看似简单的继电器动作背后,往往藏着精密的电子逻辑。当你按下启动按钮,PLC输出模块发出信号,驱动电机、阀门或报警灯——这些“…

作者头像 李华
网站建设 2026/4/23 9:47:56

旧版Intel CPU不支持HAXM?替代方案操作指南

旧版Intel CPU也能流畅跑AVD?绕过HAXM的实战指南 你是不是也遇到过这样的提示: Intel HAXM is required to run this AVD. HAXM is not installed 点“OK”后模拟器直接退出,开发流程戛然而止。更让人头疼的是,哪怕你反复下载安…

作者头像 李华