news 2026/6/9 22:24:13

Pandas数据处理技巧全解析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Pandas数据处理技巧全解析

Pandas数据处理技巧全解析

主要章节与要点

  1. UFO 报告数据(uforeports.csv

    • 读取:ufo = pd.read_csv('uforeports.csv')
    • 统计并查看类别分布:ufo['Shape Reported'].value_counts(dropna=False)(包括缺失值)
    • 填充缺失值:ufo['Shape Reported'].fillna(value='VARIOUS', inplace=True)将缺失值用VARIOUS替换
    • 常见行/列选择:使用loc选择指定行/列(例如ufo.loc[[0,1,2], :]ufo.loc[:, ['Colors Reported','Shape Reported','State']]
    • 条件过滤:ufo[ufo.City == 'Oakland']ufo.loc[ufo.City == 'Oakland','State']
    • 用例演示:删除列(.drop())、查看尾部数据(.head()/.tail()等)
  2. pandas 索引(Index)及drinksbycountry.csv

    • 读取:drinks = pd.read_csv('drinksbycountry.csv')
    • 查看索引与列:drinks.indexdrinks.columnsdrinks.shape
    • 将列设为索引:drinks.set_index('country', inplace=True),随后可用drinks.loc['Brazil','beer_servings']用国家名访问行。
    • 重置索引并恢复默认整数索引:drinks.reset_index(inplace=True)
    • 修改索引名称:drinks.index.name = 'country'drinks.index.name = None
    • 按索引或列进行统计:drinks.describe()和对统计结果的定位(例如drinks.describe().loc['25%','beer_servings']
  3. 选择多行多列与位置索引

    • loc用法:基于标签选择行列(可用行标签切片、列表或布尔掩码)。
    • iloc用法:基于整数位置选择(例如ufo.iloc[:,0:4])。
    • 列范围切片:ufo.loc[:, 'Colors Reported':'Time'](使用列名范围切片)
  4. 其它实用示例

    • 读取无表头、使用自定义分隔符的文件:pd.read_table('movieusers.csv', header=None, sep='|')
    • 统计并排序:drinks.continent.value_counts().sort_index()

关键代码片段(摘录并简短说明)

  • 填充缺失值并统计:
ufo['Shape Reported'].value_counts(dropna=False)ufo['Shape Reported'].fillna(value='VARIOUS',inplace=True)ufo['Shape Reported'].value_counts()

说明:先查看包含 NaN 的统计,再用fillna填充,最后确认填充结果。

  • 索引设置与定位:
drinks=pd.read_csv('drinksbycountry.csv')drinks.set_index('country',inplace=True)drinks.loc['Brazil','beer_servings']

说明:把country设置为索引后,可直接用国家名定位对应行的数据。

  • loc/iloc示例:
# 基于标签选择:ufo.loc[[0,1,2],:]# 基于位置选择:ufo.iloc[:,0:4]# 选择列范围:ufo.loc[:,'Colors Reported':'Time']
  • 描述性统计定位:
drinks.describe().loc['25%','beer_servings']
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 11:07:21

3步解锁:如何用消费级GPU实现专业级视频创作?

3步解锁:如何用消费级GPU实现专业级视频创作? 【免费下载链接】Wan2.1-T2V-1.3B-Diffusers 项目地址: https://ai.gitcode.com/hf_mirrors/Wan-AI/Wan2.1-T2V-1.3B-Diffusers 还在为视频生成的高门槛而烦恼吗?🎯 Wan2.1-T…

作者头像 李华
网站建设 2026/6/10 9:14:33

从零构建Conductor工作流引擎:3天快速掌握源码编译全流程

从零构建Conductor工作流引擎:3天快速掌握源码编译全流程 【免费下载链接】conductor Conductor is a microservices orchestration engine. 项目地址: https://gitcode.com/GitHub_Trending/co/conductor 想要亲手打造属于自己的微服务编排系统吗&#xff1…

作者头像 李华
网站建设 2026/6/10 11:07:22

基于SpringBoot的校园自助便利机管理系统毕业设计项目源码

基于 SpringBoot 的校园自助便利机管理系统,直击 “校园便利机商品补货不及时、消费数据无分析、设备故障响应慢、运营成本难管控” 的核心痛点,依托 SpringBoot 轻量级框架优势与校园零售场景适配能力,构建 “设备监控 库存管理 订单统计 …

作者头像 李华
网站建设 2026/6/10 11:07:29

终极draw.io图标库指南:快速打造专业级图表

终极draw.io图标库指南:快速打造专业级图表 【免费下载链接】drawio-libs Libraries for draw.io 项目地址: https://gitcode.com/gh_mirrors/dr/drawio-libs 还在为draw.io中有限的图标资源而烦恼吗?drawio-libs图标库正是你需要的解决方案&…

作者头像 李华
网站建设 2026/6/10 11:09:06

bRPC框架深度解析:工业级RPC的架构设计与性能优化

bRPC框架深度解析:工业级RPC的架构设计与性能优化 【免费下载链接】brpc 项目地址: https://gitcode.com/gh_mirrors/br/brpc 在当今分布式系统架构中,服务间的通信效率直接影响着整个系统的性能表现。面对高并发、低延迟的业务需求,…

作者头像 李华
网站建设 2026/6/9 23:55:16

音元系统:首页

音元系统 🏠 首页📖 摘要📖 目录📖 绪论📖 已有析音法📖 现行析音法📖 唱音分析法📖 音元分析法📖 音元拼音法📖 结论📖 注释📖 附录&…

作者头像 李华