news 2026/4/23 20:11:58

pytorch深度学习-excle文件读取

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
pytorch深度学习-excle文件读取

深度学习有了网络,还得加载进来,读取进来。
常用地方法就是用pandas包
比如我们有个excel文件,名叫"test.xlsx"
文件中我们随便输入一些数:

1 2 3 4 5 6 7 8 9 10 11 12

然后我们用panda包进行读取并且打出来

import pandas as pd data = pd.read_excel('test.xlsx') print(data)

但是打印出来的结果如下:

1 2 3 4 0 5 6 7 8 1 9 10 11 12

可以发现这是一件很奇怪的事情,最左侧对每一行进行了标注序号,从0开始,并且它默认将第一行数据当作了表头,或者说列名。这是因为,pd.read_excel有一个默认的参数"header=0",0表示第1行,我们可以发现python数据逻辑中的索引都是从0开始的。
为了不让它将第一行作为表的列名,我们可以在读取数据的时候,传给它参数:

import pandas as pd data = pd.read_excel('test.xlsx',header=None) print(data)

打印出的结果:

0 1 2 3 0 1 2 3 4 1 5 6 7 8 2 9 10 11 12

它自动给每一行每一列都添加了索引。

如何查看数据信息

首先我们可以打印出这个数据的大小:

print(data.shape)

也就是(3,4),表示数据是一个3行4列的矩阵。

print(data.info())会打印DataFrame的详细信息。
比如我重新读取一个excel文件,并且打印它的详细信息:

读取excel数据已经完成! <class 'pandas.core.frame.DataFrame'> RangeIndex: 1500 entries, 0 to 1499 Columns: 800 entries, 0 to 799 dtypes: float64(800) memory usage: 9.2 MB None

它告诉我们有1500,800列,dtypes64(800)说明这800列数据,都是64位浮点型。
我们可以算一下,1个64位的浮点数需要占用64bit,即64/8=8Byte,1500X800个浮点数就需要占用1500X800X8=9.610^6Byte。
也就是9.6
10^6/1024=9375KB,也就是9375/1024=9.15527 MB≈\approx9.2MB。

print(data.describe())打印出的信息是数据的摘要,每一列数据

0 1 ... 798 799 count 1500.000000 1500.000000 ... 1500.000000 1500.000000 mean 1.372601 1.372463 ... 4.958753 4.968210 std 0.685117 0.671365 ... 3.926098 3.953220 min 0.036198 0.031655 ... 0.036077 0.093626 25% 0.854522 0.866613 ... 1.217818 1.179935 50% 1.311026 1.306155 ... 2.404762 2.327359 75% 1.805137 1.796843 ... 8.893706 8.957338 max 4.146413 4.711889 ... 11.713591 12.103350 [8 rows x 800 columns]

它给出了每一列数据的统计信息

如何在读取后取出来索引某些数据

我觉得,pandas的逻辑还是以列为单位保存数据的,因为它会统计每一列的数据的统计信息。
如果要取第i列,那么可以用data[i-1],比如第1列,就是data[0]。每一列都是Series数据类型:

firstCol = data[0] #取第一列 print(f"firstCol的数据类型:{type(firstCol)}") print(f"data的数据类型:{type(data)}")

最终打印信息如下:
firstCol的数据类型:<class ‘pandas.core.series.Series’>
data的数据类型:<class ‘pandas.core.frame.DataFrame’>

有一种更好操作的方法:
data.iloc[0,:]表示取出来第1行,
data.iloc[:,0]表示取出来第1列
data.iloc[0,0]表示取出来第1行第1列。

.iloc表示按位置提取,这和matab的操作很像。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 11:27:08

海波龙(Oracle Hyperion)预算模型从系统架构与业务应用双维度可分为核心类型,核心是基于 Essbase 的多维计划类型(Plan Types),并配套业务专项模型,以下是可直接落地的分类

海波龙&#xff08;Oracle Hyperion&#xff09;预算模型从系统架构与业务应用双维度可分为核心类型&#xff0c;核心是基于 Essbase 的多维计划类型&#xff08;Plan Types&#xff09;&#xff0c;并配套业务专项模型&#xff0c;以下是可直接落地的分类与配置要点Oracle。一…

作者头像 李华
网站建设 2026/4/23 14:30:03

AIAB 转固提示 “不能到以前财年”,核心是资产会计(FI-AA)年度 / 期间未正确打开、转固日期落在已关闭年度,或资产主数据资本化日期 / 价值日不匹配,与总账 OB52 打开状态不同步导致

AIAB 转固提示 “不能到以前财年”&#xff0c;核心是资产会计&#xff08;FI-AA&#xff09;年度 / 期间未正确打开、转固日期落在已关闭年度&#xff0c;或资产主数据资本化日期 / 价值日不匹配&#xff0c;与总账 OB52 打开状态不同步导致。以下是分步骤排查与处理方案&…

作者头像 李华
网站建设 2026/4/23 14:50:54

SAP 在建工程资产类别的核心配置项清单

SAP 中在建工程&#xff08;AuC&#xff09;资产类别的核心配置项清单&#xff0c;涵盖关键标识、结算、财务等维度&#xff1a;一、核心状态标识&#xff08;区分是否为 AuC&#xff09;Status of AuC&#xff08;在建工程状态&#xff09;必选项&#xff1a;需选择Line item …

作者头像 李华
网站建设 2026/4/23 14:48:16

SAP PS 中项目类型与编码方案的匹配关联,核心是通过OPSK 定义项目类型的编码约束、OPSJ 配置编码屏蔽规则,再通过项目参数文件绑定,最终在项目创建时强制匹配

SAP PS 中项目类型与编码方案的匹配关联&#xff0c;核心是通过OPSK 定义项目类型的编码约束、OPSJ 配置编码屏蔽规则&#xff0c;再通过项目参数文件绑定&#xff0c;最终在项目创建时强制匹配&#xff1b;配置集中在项目编码屏蔽与参数文件两大节点&#xff0c;关键事务码为 …

作者头像 李华
网站建设 2026/4/23 17:21:52

实时流式识别原理揭秘:VAD分段+快速推理模拟真实效果

实时流式识别原理揭秘&#xff1a;VAD分段快速推理模拟真实效果 在语音交互日益普及的今天&#xff0c;用户早已不再满足于“说完再出结果”的传统识别模式。无论是智能客服中对即时反馈的期待&#xff0c;还是会议记录里希望看到文字逐句浮现的体验&#xff0c;都指向同一个技…

作者头像 李华
网站建设 2026/4/23 1:28:55

PHP程序员用变量思维替代模糊叙事的庖丁解牛

“用变量思维替代模糊叙事”是 PHP 程序员从“脚本编写者”跃迁为“系统工程师”的认知分水岭。 它将 主观感受&#xff08;如“我效率低”&#xff09; 转化为 客观可测的变量系统&#xff08;如“每日深度工作时长 1.2h”&#xff09;&#xff0c;从而驱动可验证、可迭代、可…

作者头像 李华