news 2026/4/23 13:15:12

深夜赶项目的程序员小张盯着屏幕打了个哈欠,突然想起上周写的疲劳检测工具还没调通。今天咱们就聊聊怎么用68个人脸特征点捕捉这种“灵魂出窍“的瞬间,关键时刻能救命

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
深夜赶项目的程序员小张盯着屏幕打了个哈欠,突然想起上周写的疲劳检测工具还没调通。今天咱们就聊聊怎么用68个人脸特征点捕捉这种“灵魂出窍“的瞬间,关键时刻能救命

采用caffe68点检测人脸特征点,识别疲劳,当眼睛缝隙小,则认为是疲劳,有python,c++版本。

先准备个能打的面部定位工具,这里我翻出了珍藏的Caffe版68点检测模型(prototxt和caffemodel文件得提前准备好,放模型目录里别乱跑)。Python版本用OpenCV的dnn模块加载最方便:

# Python版模型加载 net = cv2.dnn.readNetFromCaffe( "face_detector/68point_deploy.prototxt", "face_detector/68point_model.caffemodel" )

C++选手别急,咱们的代码也照顾到了:

// C++版模型加载 cv::dnn::Net net = cv::dnn::readNetFromCaffe( "face_detector/68point_deploy.prototxt", "face_detector/68point_model.caffemodel" );

抓取人脸关键点时有个坑要注意:输入图片的归一化方式得和模型训练时一致。比如有些模型要求像素值从0-255缩放到-1到1,有的则用均值减法,这个不搞清楚定位准头就差远了。

拿到68个点坐标后,重点锁定眼睛区域。以左眼为例(36-41号点),计算眼睛睁开程度的套路是这样的:

def eye_aspect_ratio(eye_points): # 计算垂直方向两组距离 A = np.linalg.norm(eye_points[1] - eye_points[5]) B = np.linalg.norm(eye_points[2] - eye_points[4]) # 计算水平方向距离 C = np.linalg.norm(eye_points[0] - eye_points[3]) return (A + B) / (2.0 * C)

当这个比值连续20帧低于0.25时(别照搬这个阈值,得根据实际效果调),就该触发警报了。实时检测时建议用环形队列保存最近30帧的状态,这样既省内存又能避免误判。

C++版本的计算逻辑类似,但得注意类型转换:

double calculateEAR(const vector<Point2f>& eyePoints) { double vertical1 = norm(eyePoints[1] - eyePoints[5]); double vertical2 = norm(eyePoints[2] - eyePoints[4]); double horizontal = norm(eyePoints[0] - eyePoints[3]); return (vertical1 + vertical2) / (2 * horizontal); }

实际部署时发现了几个骚操作:

  1. 在光线不足的环境下,先做个直方图均衡化再检测
  2. 侧脸时单眼闭合的情况要特殊处理
  3. 戴眼镜的同学容易被反光干扰,加个ROI区域动态调整就好

最后上个Python版的完整流程示例:

cap = cv2.VideoCapture(0) eye_history = deque(maxlen=30) # 存最近30帧状态 while True: ret, frame = cap.read() # 人脸检测和关键点预测(此处省略) left_ear = eye_aspect_ratio(left_eye_points) right_ear = eye_aspect_ratio(right_eye_points) eye_history.append((left_ear + right_ear) / 2) if len(eye_history) == 30 and np.mean(eye_history) < 0.25: cv2.putText(frame, "WAKE UP!", (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0,0,255), 2) cv2.imshow("Frame", frame)

开发这种功能最解压的时刻,就是看着检测框跟着人脸晃来晃去,比看ASMR还治愈。不过别光顾着玩,记得保存模型文件路径别写死,不然换台机器分分钟给你脸色看。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 12:35:47

军事仿真训练:生成逼真的战场通讯语音环境

军事仿真训练&#xff1a;生成逼真的战场通讯语音环境 在现代军事仿真系统中&#xff0c;一个常被忽视却至关重要的细节正悄然发生变革——声音。 过去&#xff0c;指挥员下达命令时播放的是一段预录好的标准化语音&#xff1b;侦察兵汇报敌情时&#xff0c;语气永远冷静得像读…

作者头像 李华
网站建设 2026/4/23 2:34:35

心理疏导语音包:为焦虑人群提供温暖陪伴

心理疏导语音包&#xff1a;为焦虑人群提供温暖陪伴 在快节奏的现代生活中&#xff0c;越来越多的人正默默承受着轻度焦虑、孤独与情绪波动的压力。他们未必需要临床干预&#xff0c;但渴望被倾听、被理解、被温柔对待。然而现实是&#xff0c;专业心理咨询资源稀缺、预约困难、…

作者头像 李华
网站建设 2026/4/23 12:35:55

融资BP材料准备:用GLM-TTS作为核心技术亮点展示

融资BP材料准备&#xff1a;用GLM-TTS作为核心技术亮点展示 在短视频、有声书、虚拟人内容爆发的今天&#xff0c;一个现实问题摆在内容创作者和企业面前&#xff1a;如何以低成本、高效率的方式生产“听起来像真人”的语音&#xff1f;传统配音依赖专业录音棚与人力投入&#…

作者头像 李华
网站建设 2026/4/23 11:12:14

睡眠辅助白噪音:结合ASMR元素创造助眠语音

睡眠辅助白噪音&#xff1a;结合ASMR元素创造助眠语音 在深夜辗转反侧的人越来越多。城市灯光不灭&#xff0c;信息洪流不止&#xff0c;大脑难以真正“关机”。许多人打开手机&#xff0c;点开一段雨声、海浪或森林鸟鸣&#xff0c;试图用声音屏蔽焦虑——但这些千篇一律的白噪…

作者头像 李华
网站建设 2026/4/18 22:23:16

小红书种草文案:女性视角讲述GLM-TTS改变工作方式

GLM-TTS&#xff1a;当我的声音开始为我“打工” 你有没有过这样的时刻&#xff1f; 深夜剪视频到两点&#xff0c;对着小红书种草文案反复试音&#xff1a;“这款精华真的超好用——”可怎么录都像客服播报&#xff1b;想换温柔语气&#xff0c;又怕听起来矫情&#xff1b;念…

作者头像 李华