news 2026/4/23 13:05:40

在大模型班学算法的笔记记录-形态学

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
在大模型班学算法的笔记记录-形态学

形态学操作是OpenCV中处理二值图像的核心手段,常用于目标检测、图像降噪、轮廓提取等场景

一、核心流程:从原图到二值化

形态学操作的前提是得到干净的二值图像,核心步骤为:灰度图 → 低通滤波 → 二值化

1. 灰度图转换

彩色图像需先转为灰度图(单通道),减少计算量,聚焦像素亮度信息:

import cv2 import numpy as np # 读取灰度图(参数0表示灰度模式) path = r"/Users/yangjunhui/Desktop/lenaNoise.png" img = cv2.imread(path, 0)

2. 低通滤波:去除噪声

原始图像可能存在椒盐噪声,用高斯滤波(低通滤波的一种)平滑图像,保留主体的同时弱化噪点:

# 高斯滤波:(5,5)为滤波核尺寸,0为标准差(自动计算) blur = cv2.GaussianBlur(img,(5,5),0)

作用:模糊图像边缘,减少后续二值化的噪点干扰。

3. 二值化:黑白分离

将灰度图转为仅含0(黑)、255(白)的二值图像,突出目标区域:

# 二值化:阈值35,超过则设为255(白),否则0(黑) ret, ths1_img = cv2.threshold(blur, 35, 255, cv2.THRESH_BINARY)

关键:阈值需根据图像调整,目标是让主体为白色,背景为黑色。

二、形态学核心操作:腐蚀与膨胀

二值化后,通过腐蚀/膨胀调整目标区域的形态,解决“毛刺”“孔洞”等问题。

1. 先搞懂:形态学核(Kernel)

操作的“工具”是卷积核,决定腐蚀/膨胀的范围和形状:

# 自定义3×3全1核(常用尺寸,可根据需求调整为5×5、7×7等) kernel = np.ones((3,3), np.uint8)
  • np.ones((3,3)):生成3行3列全1矩阵,代表以当前像素为中心,覆盖周围8个像素;
  • np.uint8:像素值专用类型(0-255),保证计算兼容。

OpenCV也提供预设核(无需手动定义):

# 矩形核(默认) kernel_rect = cv2.getStructuringElement(cv2.MORPH_RECT, (5,5)) # 椭圆核(更贴合圆形目标) kernel_ellipse = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (5,5))

2. 腐蚀(Erosion):去毛刺、瘦化目标

原理

用核扫描每个像素,仅当核覆盖的所有像素都是白色(255)时,中心像素才保留白色,否则设为黑色

代码实现

# 腐蚀操作:迭代1次(次数越多,腐蚀越强) erosion_img = cv2.erode(ths1_img, kernel, iterations = 1) # 显示结果(自定义显示函数) def show(img, title=''): cv2.imshow(title, img) cv2.waitKey(0) show(erosion_img, '腐蚀后')

效果

  • 白色前景区域“收缩”,边缘被侵蚀,细小花絮/毛刺(噪点)被消除;
  • 孤立的白色小噪点(如单个像素)会被完全去掉;
  • 目标区域之间的窄连接可能被断开。

适用场景:去除二值图中的白色噪点、细化目标边缘。

3. 膨胀(Dilation):填孔洞、加粗目标

原理

与腐蚀相反,核扫描时只要覆盖区域内有至少一个白色像素,中心像素就设为白色

代码实现

# 膨胀操作:迭代1次 dilate_img = cv2.dilate(ths1_img, kernel, iterations=1) show(dilate_img, '膨胀后')

效果

  • 白色前景区域“扩张”,细小孔洞/断裂处被填充;
  • 目标边缘变粗,孤立的黑色小噪点被覆盖;
  • 断裂的线条可被重新连接。

适用场景:填补目标区域的黑色孔洞、连接断裂的轮廓。

4. 拓展:形态学梯度

通过“膨胀-腐蚀”“膨胀-原图”或“原图-腐蚀”,可提取目标的边缘像素,得到空心轮廓效果,常用于轮廓检测。

四、完整实战代码

import cv2 import numpy as np # 自定义显示函数 def show(img, title=''): cv2.imshow(title, img) cv2.waitKey(0) cv2.destroyWindow(title) # 关闭窗口,避免占用内存 # 1. 读取灰度图 path = r"/Users/yangjunhui/Desktop/lenaNoise.png" img = cv2.imread(path, 0) show(img, '原始灰度图') # 2. 高斯滤波降噪 blur = cv2.GaussianBlur(img, (5,5), 0) show(blur, '高斯滤波后') # 3. 二值化 ret, ths1_img = cv2.threshold(blur, 35, 255, cv2.THRESH_BINARY) show(ths1_img, '二值化后') # 4. 定义形态学核 kernel = np.ones((3,3), np.uint8) # 5. 腐蚀操作 erosion_img = cv2.erode(ths1_img, kernel, iterations=1) show(erosion_img, '腐蚀后') # 6. 膨胀操作 dilate_img = cv2.dilate(ths1_img, kernel, iterations=1) show(dilate_img, '膨胀后')

五、总结

操作核心效果适用场景
腐蚀去毛刺、瘦化目标消除白色噪点、细化边缘
膨胀填孔洞、加粗目标填补黑色孔洞、连接断裂轮廓
梯度提取边缘、生成空心轮廓目标轮廓检测

形态学操作的关键是“先腐蚀去噪,再膨胀修复”(开运算),或“先膨胀填洞,再腐蚀还原”(闭运算),灵活组合可解决大部分二值图处理问题。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 7:34:01

【Vue.js:构建现代Web应用的渐进式框架--web技术栈】

一、Vue.js的核心哲学 1.1 渐进式框架设计 Vue.js最大的特色是其渐进式架构设计。与其他全功能框架不同,Vue允许开发者从核心库开始,根据项目需求逐步添加生态系统中的工具和功能: 核心库:声明式渲染和组件系统路由:Vu…

作者头像 李华
网站建设 2026/4/23 11:46:27

加密PDF解析的Dify内存占用(专家级调优指南,仅限内部分享)

第一章:加密PDF解析的Dify内存占用问题综述 在使用 Dify 平台处理加密 PDF 文件的解析任务时,部分用户反馈系统出现显著的内存占用上升现象,严重时可导致服务响应延迟甚至进程崩溃。该问题主要出现在高并发或大文件批量处理场景中&#xff0c…

作者头像 李华
网站建设 2026/4/23 11:47:09

Pytest实践:Python测试技术基础知识

一、简介 在软件开发领域,确保代码的正确性和稳健性至关重要。这就是软件测试发挥作用的地方。Python 是一种通用且广泛使用的编程语言,提供了大量的工具和库来帮助测试过程。 其中,Pytest就是一个很好用的测试框架,可以在 Pyth…

作者头像 李华
网站建设 2026/4/23 11:52:16

没有中兴的智谱,被民间华强北盯上了

开源之后,市场能拼出一部“AI手机”吗?作者|王浩然编辑|古廿最近智谱的广告出现在机场广告牌,打出了一整套AI叙事的新标签:“有的AI,提供情绪价值”“智谱AI,提供商业价值”。配合上醒目的LOGO,…

作者头像 李华
网站建设 2026/4/23 11:45:47

《#{} vs ${}:MyBatis 里这俩符号,藏着性能与安全的 “生死局”》

1.多表查询多表查询和单表查询类似,只是SQL不同⽽已数据准备:对应Model:数据查询SQL:补充实体类:接⼝定义:字段与实体类属性不一致的解决方式:当数据库字段名与实体类属性名不匹配时,可通过ResultMap(自定义映射关系)或…

作者头像 李华