news 2026/5/12 16:56:38

别再让 NaN 和 None 把你搞晕了:谈谈 Python 里的“空值”哲学

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
别再让 NaN 和 None 把你搞晕了:谈谈 Python 里的“空值”哲学

搞数据处理或者写后端接口的朋友,大概率都经历过这种“鬼打墙”的时刻:

数据库里明明是NULL,读到 Python 里变成了None,扔进 Pandas 做个计算变成了NaN,最后想转成 JSON 返回给前端时,因为包含NaN直接报错,或者变成了一个前端 JS 无法识别的NaN符号。

最近读了 Filip Mularczyk 的一篇名为《Nothing to Declare》的文章,很有共鸣。特别是在 Pandas 3.0 普及的当下,我们处理“没有值”这种状态时,依然容易掉坑里。

今天就来聊聊这三个长得像、但脾气完全不同的“空值”:NaNNonenull,以及如何在工程中优雅地处理它们。

三个“空”,三种命

首先得祛魅,这三位在 Python 的内存里完全是三个物种:

  1. None (Python 的亲儿子)

    • 它是 Python 的内置对象,属于NoneType
    • 它代表**“逻辑上的无”**。比如“用户没有填昵称”,这就是None
    • 它是一个单例(Singleton),用来做判断时,永远要用is None而不是== None
  2. NaN (数学界的怪胎)

    • 全称 Not a Number,但它在 Python 里居然是float类型!
    • 它代表**“数值上的缺失或计算错误”**。比如0/0或者读取了一个空的 CSV 数值格。
    • 它最反直觉的地方在于“六亲不认”:NaN != NaN是成立的。这意味着你没法用==去在列表里找它,必须用math.isnan()pd.isna()
  3. null (外来的和尚)

    • Python 语法里没有null
    • 它通常存在于JSONSQL中。
    • 当我们谈论null时,通常是在讨论数据交换(IO)。当一个 JSON 的null传进来,Python 的json库默认把它转成None

工程实践中的“灾难现场”

Filip 在文章里提到了一个非常典型的场景:使用 Pydantic 做数据校验

假设前端给你发来这样一个 JSON:

{"temperature":null,"humidity":"NaN"}

如果你在 Pydantic 模型里定义字段为float,事情就变得微妙了。

  • 对于null:Pydantic 默认可能抛错,除非你声明类型为float | None(或者Optional[float])。
  • 对于"NaN":Pydantic 会很“贴心”地把它转成 Python 的float('nan')

问题来了:当你把这个清洗后的模型存入数据库,或者做数学运算时,混入的NoneNaN会导致完全不同的结果。None可能会让数学运算抛出 TypeError,而NaN会像病毒一样,让所有跟它运算的结果都变成NaN

怎么处理才优雅?

结合文章观点和现在的工程习惯,我有几个建议:

1. 语义分离:是“没填”还是“算错了”?

在定义数据模型(Model)时,要明确区分这两种状态。

  • 如果是因为用户没填,或者数据暂缺,尽量保持为None
  • 如果是传感器读数错误、计算溢出,保留NaN是合理的,因为它保留了“这是一个数值类型”的特征。
2. 利用 Pydantic 的 Validator

不要指望自动转换能完全符合心意。在 Pydantic 中,最好写个field_validator(v2 写法):

# 伪代码示例:确保导出时行为可控@field_validator('score')@classmethoddefhandle_empty_score(cls,v):ifvisNone:returnfloat('nan')# 如果业务要求必须是数值计算returnv

或者反过来,在序列化成 JSON 之前,把所有的NaN清洗回None,因为标准的 JSON 规范其实并不支持NaN(虽然有些解析器能容忍),传null给前端通常是最安全的做法。

3. Pandas 3.0 的新常态

现在是 2026 年,Pandas 3.0 已经让Nullable类型(如Float64Int64,注意是大写首字母)成为了主流。

以前最让人头大的问题是:一个整数列里混进一个NaN,整列会被强制强转成浮点数。现在,推荐使用 PyArrow 后端或者 Pandas 的 Nullable 类型。这允许None(在 Pandas 里表现为<NA>)和整数和平共处,而不需要动不动就退化成浮点型的NaN

总结

并没有一种万能的“空值”能解决所有问题。

  • 做数学计算:请用NaN,并小心它的传染性。
  • 做逻辑流转:请用None
  • 做接口交互:认准null,并确保在 Python 边界处(比如 Pydantic 层)把NaNNone的转换规则定死,别让它们“自由发挥”。

写代码时多想一步:“这个空,到底是因为不存在,还是因为算不出来?”这一秒的思考,能帮你省下好几个小时 debug 的时间。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/2 1:11:34

用 XinServer 给桌面端应用搭建轻量后台

用 XinServer 给桌面端应用搭建轻量后台 最近好几个做桌面端应用的朋友跑来问我&#xff0c;说他们想给软件加个数据同步、用户管理或者简单的后台管理功能&#xff0c;但一提到要自己搞服务器、写后端接口、设计数据库就头大。有个兄弟甚至说&#xff1a;“我连 SELECT * FRO…

作者头像 李华
网站建设 2026/5/11 17:05:17

用React Native开发OpenHarmony应用:Image图片滤镜效果

React Native for OpenHarmony 实战&#xff1a;Image 图片滤镜效果详解 摘要 本文深入探讨在 React Native 0.72.5 环境下&#xff0c;针对 OpenHarmony 6.0.0 (API 20) 平台开发应用时&#xff0c;如何利用 Image 组件实现高效、流畅的图片滤镜效果。文章结合 AtomGitDemos…

作者头像 李华
网站建设 2026/4/23 9:16:30

技术演进中的开发沉思-355:重排序(上)

今天梳理重排序三类核心类型表非常精准&#xff0c;把 JMM 中重排序的来源、本质、范畴划分得一清二楚&#xff0c;这也是理解并发有序性问题的核心基础 —— 重排序并非 “bug”&#xff0c;而是编译器 / 处理器为提升执行效率做的合法优化&#xff0c;其核心底线是不破坏单线…

作者头像 李华
网站建设 2026/5/10 8:33:19

AI写作大师-Qwen3-4B-Instruct参数详解:low_cpu_mem_usage加载与token速率优化

AI写作大师-Qwen3-4B-Instruct参数详解&#xff1a;low_cpu_mem_usage加载与token速率优化 1. 为什么4B模型在CPU上也能“思考”得又稳又准&#xff1f; 你可能已经试过不少轻量级AI写作工具&#xff0c;输入指令后秒出结果——但内容常常泛泛而谈、逻辑断层、代码跑不通。而…

作者头像 李华
网站建设 2026/5/9 15:20:28

MedGemma 1.5快速上手:基于Chain-of-Thought的本地医学问答完整指南

MedGemma 1.5快速上手&#xff1a;基于Chain-of-Thought的本地医学问答完整指南 1. 这不是另一个“能聊医学”的AI&#xff0c;而是一个你能在自己电脑上运行的临床推理伙伴 你有没有试过在深夜查一个医学术语&#xff0c;翻了三页维基百科和两篇综述&#xff0c;还是没搞懂它…

作者头像 李华
网站建设 2026/5/10 11:18:32

机器人开发工程师职位深度解析与面试指南

重庆兆光科技股份有限公司 机器人开发工程师 职位信息 【工作内容】 - 负责或参与机器人系统的设计与开发,包括硬件集成、软件编程及算法实现; - 参与机器人项目的规划,制定详细的技术方案,并确保项目按时交付; - 进行技术研究,跟踪行业动态,提升产品性能与用户体验; -…

作者头像 李华