AI读脸术与数据库对接：识别结果持久化存储教程-深圳市維司達科技有限公司

AI读脸术与数据库对接：识别结果持久化存储教程

1. 什么是AI读脸术：从图像中提取人脸属性

你有没有想过，一张普通的人脸照片里，其实藏着不少可被机器读懂的信息？比如这个人是男是女、大概多大年纪——这些看似需要人类经验判断的内容，现在用几行代码就能自动完成。这背后的技术，就是我们常说的“AI读脸术”。

这里的“读脸”，不是科幻电影里的读心术，而是基于计算机视觉的人脸属性分析。它不涉及身份识别、不关联个人隐私信息，只专注两个基础但实用的维度：性别分类和年龄段估算。比如输入一张自拍照，模型会告诉你“Male, (35-42)”；上传一张明星合影，它能逐个框出人脸并标注对应的性别与年龄区间。

这项能力之所以能落地，关键在于它足够轻量、足够快、足够简单。不像动辄需要GPU和复杂框架的大模型，本方案完全基于OpenCV自带的DNN模块，仅依赖Caffe格式的预训练模型，连PyTorch或TensorFlow都不用装。这意味着你可以在一台普通笔记本上，秒级启动服务，上传图片后不到1秒就看到结果。

更重要的是，它不是一次性的演示玩具。模型文件已固化在系统盘/root/models/目录下，无论镜像重启多少次、保存再加载多少回，模型始终在线、稳定可用。这种“开箱即用+长期可靠”的组合，正是工程化部署最看重的起点。

2. 快速上手：三步完成人脸属性识别

2.1 启动服务与访问界面

镜像部署完成后，你会在平台界面看到一个醒目的HTTP访问按钮。点击它，浏览器将自动打开WebUI页面——无需配置端口、不用记IP，一切由平台自动处理。

这个界面极简：没有菜单栏、没有设置项，只有一个清晰的上传区域。它不追求功能堆砌，只做一件事：让你把图交出来，它把结果画回去。

2.2 上传图片与自动分析

支持任意常见格式的图片：JPG、PNG，甚至截图直传也完全没问题。你可以用手机自拍一张，也可以找张高清明星合照试试水。只要画面中有人脸（正脸或轻微侧脸均可），系统就能检测出来。

上传后，后台会立刻执行三步流水线：

第一步：用deploy.prototxt+res10_300x300_ssd_iter_140000.caffemodel定位所有人脸位置；
第二步：对每个检测框裁剪出的人脸区域，送入性别模型gender_net.caffemodel，输出“Male”或“Female”；
第三步：同一区域再送入年龄模型age_net.caffemodel，输出8个年龄段中的一个，如(25-32)。

整个过程在CPU上完成，平均耗时约0.3~0.6秒（取决于图片尺寸和人脸数量），毫无卡顿感。

2.3 查看结果：可视化标注一目了然

结果以原图叠加方式返回，所有信息都直接“画”在图上：

每张人脸被一个蓝色方框精准圈出；
方框左上角显示标签，格式统一为Gender, (AgeRange)，例如Female, (18-24)；
字体清晰、颜色对比强，即使缩略图也能轻松辨认。

你不需要打开开发者工具查JSON，也不用切换标签页看日志——所见即所得。这种“结果即画面”的设计，让非技术人员也能第一时间理解AI做了什么、做得准不准。

3. 超越展示：把识别结果存进数据库

光在图上画几个字，只是第一步。真正让AI能力产生业务价值的，是把每次识别的结果留下来、管起来、用起来。比如记录门店客流的性别分布与年龄结构，或者统计线上活动参与者的画像特征。这就需要把“识别结果”变成“结构化数据”，并持久化到数据库中。

本教程将带你完成这个关键跃迁：从单次图像分析，升级为带存储能力的AI服务。我们将使用轻量但可靠的SQLite作为数据库，全程不引入额外服务依赖，所有操作都在当前镜像内完成。

3.1 数据库设计：一张表搞定核心信息

我们新建一张名为face_analysis_records的表，字段设计直击实用需求：

字段名	类型	说明
`id`	INTEGER PRIMARY KEY AUTOINCREMENT	自增主键，唯一标识每条记录
`image_name`	TEXT NOT NULL	原图文件名（如`selfie_20240512.jpg`）
`timestamp`	TEXT NOT NULL	识别时间，格式`YYYY-MM-DD HH:MM:SS`
`face_count`	INTEGER DEFAULT 0	图中检测到的人脸总数
`gender`	TEXT	性别标签（Male/Female），若多人脸取第一个
`age_range`	TEXT	年龄区间（如`(25-32)`），若多人脸取第一个
`bbox_x`,`bbox_y`,`bbox_w`,`bbox_h`	REAL	人脸框坐标与宽高（归一化值，0~1之间）

为什么这样设计？
不存原始图片二进制数据，节省空间，只存文件名便于溯源；
时间戳用字符串而非时间类型，避免跨平台兼容问题；
坐标归一化存储，适配不同分辨率输入，后续做统计分析更灵活；
首个人脸作为代表，兼顾简洁性与典型性，如需全量可扩展为一对多关系。

3.2 修改后端逻辑：识别完顺手存一条

原WebUI后端基于Flask构建，核心处理函数位于app.py中。我们要做的，是在图像分析完成后，追加数据库写入逻辑。

首先，在文件开头添加SQLite支持：

import sqlite3 from datetime import datetime

然后，在处理上传请求的路由函数中（通常为@app.route('/upload', methods=['POST'])），找到模型推理完成后的代码块，在其下方插入以下内容：

# --- 新增：保存识别结果到数据库 --- db_path = "/root/face_analysis.db" conn = sqlite3.connect(db_path) cursor = conn.cursor() # 创建表（如果不存在） cursor.execute(''' CREATE TABLE IF NOT EXISTS face_analysis_records ( id INTEGER PRIMARY KEY AUTOINCREMENT, image_name TEXT NOT NULL, timestamp TEXT NOT NULL, face_count INTEGER DEFAULT 0, gender TEXT, age_range TEXT, bbox_x REAL, bbox_y REAL, bbox_w REAL, bbox_h REAL ) ''') # 插入记录（以首个人脸为例） if len(detections) > 0: det = detections[0] # 取第一个检测结果 x, y, w, h = det[0], det[1], det[2], det[3] cursor.execute(''' INSERT INTO face_analysis_records (image_name, timestamp, face_count, gender, age_range, bbox_x, bbox_y, bbox_w, bbox_h) VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?) ''', ( filename, datetime.now().strftime("%Y-%m-%d %H:%M:%S"), len(detections), gender_label, age_label, x, y, w, h )) conn.commit() conn.close() # --- 数据库存储结束 ---

这段代码做了四件事：连接数据库、建表（首次运行时）、提取首个人脸的关键信息、插入一条新记录。它不打断原有流程，只是在结果生成后“顺手存一笔”，对响应速度影响微乎其微。

3.3 验证存储效果：用命令行快速查数据

镜像已预装sqlite3命令行工具。识别几张图后，你可以随时进入终端验证数据是否真实落库：

# 进入数据库 sqlite3 /root/face_analysis.db # 查看表结构 .schema face_analysis_records # 查询最近3条记录 SELECT id, image_name, timestamp, gender, age_range FROM face_analysis_records ORDER BY id DESC LIMIT 3; # 退出 .quit

你会看到类似这样的输出：

1|selfie_20240512.jpg|2024-05-12 14:22:31|1|Female|(25-32) 2|celebrity_group.png|2024-05-12 14:23:05|3|Male|(38-43) 3|family_photo.jpg|2024-05-12 14:24:17|4|Female|(4-8)

每一行都是一次真实的识别行为留下的数字足迹。它们安静躺在磁盘上，随时等待被查询、被导出、被接入报表系统。

4. 实用增强技巧：让存储更聪明、更可控

光能存还不够，还得存得明白、查得方便、用得安心。以下是几个经过实测的增强建议，无需复杂改造，加几行代码就能见效。

4.1 自动清理旧数据：防止数据库无限膨胀

SQLite虽轻量，但日积月累也会变大。我们给它加个“自动瘦身”机制：只保留最近30天的数据。

在应用启动时（比如if __name__ == '__main__':下方），添加清理逻辑：

# 清理30天前的记录 conn = sqlite3.connect("/root/face_analysis.db") cursor = conn.cursor() cursor.execute("DELETE FROM face_analysis_records WHERE timestamp < ?", (datetime.now().strftime("%Y-%m-%d 00:00:00"),)) conn.commit() conn.close()

效果：每天首次启动服务时自动执行，确保数据库体积可控，且不影响实时识别性能。

4.2 支持批量导出：一键生成CSV用于分析

运营同学常需要把数据拉到Excel里画图。我们在WebUI中增加一个“导出全部”按钮，后端生成标准CSV：

@app.route('/export-csv') def export_csv(): conn = sqlite3.connect("/root/face_analysis.db") cursor = conn.cursor() cursor.execute("SELECT * FROM face_analysis_records ORDER BY id") rows = cursor.fetchall() conn.close() output = io.StringIO() writer = csv.writer(output) writer.writerow(['id', 'image_name', 'timestamp', 'face_count', 'gender', 'age_range', 'bbox_x', 'bbox_y', 'bbox_w', 'bbox_h']) writer.writerows(rows) response = make_response(output.getvalue()) response.headers["Content-Disposition"] = "attachment; filename=face_analysis_export.csv" response.headers["Content-type"] = "text/csv" return response

前端只需加个链接<a href="/export-csv"> 导出全部记录为CSV</a>，点击即得可直接打开的表格文件。

4.3 添加简单统计看板：一眼看清分布趋势

在WebUI首页下方，新增一个统计区块，用纯HTML+少量JS展示基础聚合结果：

<div class="stats-card"> <h3> 今日识别概览</h3> <p><strong>总人次：</strong><span id="total-count">--</span></p> <p><strong>女性占比：</strong><span id="female-ratio">--%</span></p> <p><strong>主力年龄段：</strong><span id="dominant-age">--</span></p> </div> <script> fetch('/api/stats') .then(r => r.json()) .then(data => { document.getElementById('total-count').textContent = data.total; document.getElementById('female-ratio').textContent = data.female_ratio + '%'; document.getElementById('dominant-age').textContent = data.dominant_age || '暂无'; }); </script>

后端/api/stats接口返回JSON即可：

@app.route('/api/stats') def get_stats(): conn = sqlite3.connect("/root/face_analysis.db") cursor = conn.cursor() # 总数 cursor.execute("SELECT COUNT(*) FROM face_analysis_records WHERE date(timestamp) = date('now')") total = cursor.fetchone()[0] # 女性比例（今日） cursor.execute("SELECT COUNT(*) FROM face_analysis_records WHERE gender='Female' AND date(timestamp) = date('now')") female = cursor.fetchone()[0] female_ratio = round(female / total * 100, 1) if total > 0 else 0 # 主力年龄段（今日出现最多的一组） cursor.execute(""" SELECT age_range, COUNT(*) as cnt FROM face_analysis_records WHERE date(timestamp) = date('now') GROUP BY age_range ORDER BY cnt DESC LIMIT 1 """) dominant = cursor.fetchone() dominant_age = dominant[0] if dominant else None conn.close() return jsonify({ "total": total, "female_ratio": female_ratio, "dominant_age": dominant_age })