news 2026/4/22 11:38:31

DAY28 元组和OS模块

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DAY28 元组和OS模块

前言:今天主要学习了两个方面的基础知识--元组和OS模块。理解和应用好这两个方面将为我们后续进阶深度学习打下了坚实的基础。

一、元组

元组的特点:

1. 有序,可以重复,这一点和列表一样

2. 元组中的元素不能修改,这一点非常重要,深度学习场景中很多参数、形状定义好了确保后续不能被修改。

对于元组方面基础的一些用法在此我们不做过多的赘述,我们主要来讲一讲其和列表结合起来在管道工程中的应用。

3.示例

管道工程中pipeline类接收的是一个包含多个小元组的 列表 作为输入。

可以这样理解这个结构

(1) 列表 []: 定义了步骤执行的先后顺序。Pipeline 会按照列表中的顺序依次处理数据。之所以用列表,是未来可以对这个列表进行修改。

(2) 元组 (): 用于将每个步骤的名称和处理对象捆绑在一起。名称用于在后续访问或设置参数时引用该步骤,而对象则是实际执行数据转换或模型训练的工具。固定了操作名+操作

示例代码:

# 管道按顺序执行以下步骤: # - StandardScaler(): 标准化数据(移除均值并缩放到单位方差) # - LogisticRegression(): 逻辑回归分类器 pipeline = Pipeline([ ('scaler', StandardScaler()), ('logreg', LogisticRegression()) ])

二、OS模块

好的代码组织和有效的文件管理是大型深度学习项目的基石。os 模块是实现这些目标的重要组成部分。

一些基本操作:

1、获取当前工作目录

示例代码:

import os # os是系统内置模块,无需安装 os.getcwd() # get current working directory 获取当前工作目录的绝对路径

2、获取当前工作目录下的文件列表

示例代码:

os.listdir() # list directory 获取当前工作目录下的文件列表

3、环境变量方法

示例代码:

# os.environ 表现得像一个字典,包含所有的环境变量 os.environ # 使用 .items() 方法可以方便地同时获取变量名(键)和变量值,之前已经提过字典的items()方法,可以取出来键和值 # os.environ是可迭代对象 for variable_name, value in os.environ.items(): # 直接打印出变量名和对应的值 print(f"{variable_name}={value}") # 你也可以选择性地打印总数 print(f"\n--- 总共检测到 {len(os.environ)} 个环境变量 ---")

4.目录树

os.walk() 是 Python os 模块中一个非常有用的函数,它用于遍历(或称“行走”)一个目录树。其遍历过程采取的是深度优先策略。

其每次遍历主要返回三个顺序的参数:

当前访问目录 (dirpath)

子目录列表 (dirnames)

文件列表 (filenames)

以下面这个目录结构为例:

my_project/
├── data/
│ ├── processed/ ← 空文件夹
│ └── raw/
│ └── data1.csv
├── src/
│ ├── models/
│ │ └── model_a.py
│ └── utils.py
├── main.py
└── README.md

访问流程:

步骤1: 到达 my_project

看到: 子目录=['data', 'src'], 文件=['main.py', 'README.md']
先进入第一个子目录 'data'

步骤2: 到达 my_project/data

看到: 子目录=['processed', 'raw'], 文件=[]
先进入第一个子目录 'processed'

步骤3: 到达 my_project/data/processed

看到: 子目录=[], 文件=[]
这是死胡同,退回到 my_project/data

步骤4: 还在 my_project/data

进入下一个子目录 'raw'

步骤5: 到达 my_project/data/raw

看到: 子目录=[], 文件=['data1.csv']
这是死胡同,退回到 my_project/data
但 my_project/data 的子目录都探索完了,退回到 my_project

步骤6: 回到 my_project

进入下一个子目录 'src'

步骤7: 到达 my_project/src

看到: 子目录=['models'], 文件=['utils.py']
进入子目录 'models'

步骤8: 到达 my_project/src/models

看到: 子目录=[], 文件=['model_a.py']
探索完成!

示例代码:

import os start_directory = os.getcwd() # 假设这个目录在当前工作目录下 print(f"--- 开始遍历目录: {start_directory} ---") for dirpath, dirnames, filenames in os.walk(start_directory): print(f" 当前访问目录 (dirpath): {dirpath}") print(f" 子目录列表 (dirnames): {dirnames}") print(f" 文件列表 (filenames): {filenames}")

@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 13:59:41

DL00308 - 高光谱遥感反演机器学习代码中的植被指数分析

DL00308-高光谱遥感反演机器学习代码植被指数分析python 原始光谱一阶导数光谱的相关性以及水平检验, 植被指数、遥感参数的相关系数以及水平检验, 去偏移值最小二乘回归最近在研究高光谱遥感反演机器学习代码,其中植被指数的分析部分真的很有趣😃。 原始…

作者头像 李华
网站建设 2026/4/23 9:20:16

如何将外包与内部团队的平衡

在当今竞争激烈的商业环境中,企业在资源分配与团队管理上面临着前所未有的挑战。**要实现外包与内部团队的平衡,关键在于明确核心业务边界、建立协同机制、强化沟通与文化融合。**只有做到“取其所长、补己所短”,企业才能在保持灵活性的同时…

作者头像 李华
网站建设 2026/4/21 17:36:43

谁懂大龄程序员[特殊字符]‍[特殊字符]的痛啊

这是来自小红书一位后端开发工程师分享的和前段老婆关于裁员失业的焦虑。 说真的,这两年看着身边一个个搞Java、C、前端、数据、架构的开始卷大模型,挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis,稳稳当当过日子。 …

作者头像 李华
网站建设 2026/4/23 1:07:08

Docker(单机Kafka安装)

1. pull镜像 docker pull zookeeper docker pull wurstmeister/kafka2. 创建通信网络。zookeeper和kafka之间的通信 docker network create kafka_zk_net查看网络 docker network ls docker network inspect kafka_zk_net3. 创建容器 docker run --netkafka_zk_net --name z…

作者头像 李华
网站建设 2026/4/23 9:18:42

DDD碎片记录 01.落地到数据库设计

系统用例设计,分析系统需要完成的功能。分析系统的业务实体,在领域模型分析中采用类图的形式,每个类可以通过其属性来表述数据结构,又可以通过添加方法来描述对数据结构的处理。 因此在领域模型的设计过程中,即完成了对…

作者头像 李华
网站建设 2026/4/22 21:56:20

推荐汽车制造业拧紧工艺智能化解决方案有哪些?

拧紧工艺:汽车制造中的隐形守护者在当今汽车制造业的快节奏发展环境中,拧紧工艺系统作为连接关键零部件的隐形支柱,扮演着不可忽视的角色。想象一下,一辆汽车的发动机缸盖螺栓如果不精确拧紧,可能会导致密封失效&#…

作者头像 李华