毕业设计救星：AI骨骼检测开题到落地，云端GPU全程护航-深圳市維司達科技有限公司

毕业设计救星：AI骨骼检测开题到落地，云端GPU全程护航

引言：当毕业设计遇上AI骨骼检测

每到毕业季，计算机专业的同学们最头疼的就是选题和开题。去年我的学弟小王就遇到了这样的困境：导师要求他做一个基于骨骼检测的体感游戏原型，但校园网连不上实验室服务器，本地电脑又跑不动深度学习模型。就在他焦头烂额时，我们发现了云端GPU这个"救命稻草"——用按量付费的云端服务，三天就完成了可行性验证。

AI骨骼检测（又称人体关键点检测）是计算机视觉中的经典任务，它能从图像或视频中识别出人体的关节位置（如肩膀、手肘、膝盖等）。这项技术广泛应用于体感游戏、健身指导、医疗康复等领域。对于本科生毕业设计来说，它既不会太简单显得没技术含量，又不会太难导致无法完成。

本文将带你从零开始，用PyTorch实现一个基础版的人体关键点检测系统，并部署到云端GPU环境。即使你完全没有AI项目经验，跟着步骤操作也能在几天内做出可演示的Demo。

1. 环境准备：5分钟搭建云端开发环境

1.1 选择适合的云端GPU平台

对于学生项目，我推荐使用按量付费的云服务，主要有三大优势： - 无需长期租用，成本可控（每小时几毛到几块钱） - 预装好了CUDA、PyTorch等深度学习环境 - 可以随时暂停，下次继续使用

在CSDN星图镜像广场中搜索"PyTorch人体关键点检测"，能找到多个预置环境镜像。我们选择包含以下组件的镜像： - PyTorch 1.8+ - CUDA 11.1 - OpenCV - 常用计算机视觉库

1.2 启动云端实例

登录后按照以下步骤操作： 1. 在镜像市场选择"PyTorch人体关键点检测"镜像 2. 选择GPU机型（初学者用T4或P100就够用） 3. 设置登录密码 4. 点击"立即创建"

等待2-3分钟，系统会自动完成环境配置。你会获得一个带GPU的远程开发环境，可以直接通过网页终端或SSH连接。

# 连接成功后，验证GPU是否可用 nvidia-smi

如果看到显卡信息，说明环境配置正确。接下来我们安装项目所需的额外依赖：

pip install matplotlib scikit-image

2. 快速实现人体关键点检测

2.1 下载预训练模型

从头训练一个关键点检测模型需要大量数据和计算资源，对学生项目不现实。我们可以使用开源的预训练模型，这里选择MPII数据集上训练的HRNet模型。

import torch from torchvision.models.detection import keypointrcnn_resnet50_fpn # 加载预训练模型 model = keypointrcnn_resnet50_fpn(pretrained=True) model.eval() # 设置为评估模式

这个模型能检测17个人体关键点，包括： - 头部（鼻子、左右眼、左右耳） - 躯干（颈部、左右肩、左右髋） - 四肢（左右肘、左右腕、左右膝、左右踝）

2.2 编写检测代码

创建一个detect.py文件，写入以下代码：

import cv2 import torch import numpy as np from torchvision.transforms import functional as F def detect_keypoints(image_path): # 读取图像 image = cv2.imread(image_path) image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) # 转换为PyTorch张量 image_tensor = F.to_tensor(image) # 使用模型预测 with torch.no_grad(): output = model([image_tensor]) # 提取关键点 keypoints = output[0]['keypoints'][0].cpu().numpy() # 可视化结果 for x, y, conf in keypoints: if conf > 0.5: # 只显示置信度高的关键点 cv2.circle(image, (int(x), int(y)), 5, (255, 0, 0), -1) return image # 测试一张图片 result = detect_keypoints("test.jpg") cv2.imwrite("result.jpg", cv2.cvtColor(result, cv2.COLOR_RGB2BGR))

2.3 运行测试

准备一张包含人物的测试图片test.jpg，运行脚本：

python detect.py

执行完成后，会生成result.jpg，上面标出了检测到的人体关键点。如果一切顺利，你应该能看到类似下面的效果：

3. 进阶应用：开发简易体感游戏

有了关键点检测能力，我们可以开发一个简单的体感游戏Demo。这里以"举手计数"游戏为例，当玩家举起右手时得分。

3.1 实时视频处理

修改之前的代码，实现摄像头实时检测：

import cv2 import time # 打开摄像头 cap = cv2.VideoCapture(0) while True: ret, frame = cap.read() if not ret: break # 转换为RGB格式 rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB) # 转换为张量并预测 tensor = F.to_tensor(rgb_frame) with torch.no_grad(): output = model([tensor]) # 处理检测结果 if len(output[0]['keypoints']) > 0: keypoints = output[0]['keypoints'][0].cpu().numpy() # 获取右手腕坐标（第10个关键点） right_wrist = keypoints[9] if right_wrist[2] > 0.5: # 置信度检查 x, y = int(right_wrist[0]), int(right_wrist[1]) cv2.circle(frame, (x, y), 10, (0, 255, 0), -1) # 显示画面 cv2.imshow('Gesture Game', frame) # 按q退出 if cv2.waitKey(1) & 0xFF == ord('q'): break cap.release() cv2.destroyAllWindows()

3.2 添加游戏逻辑

扩展上面的代码，实现举手计数功能：

score = 0 last_hand_position = None while True: # ...（前面的摄像头处理代码不变） if len(output[0]['keypoints']) > 0: keypoints = output[0]['keypoints'][0].cpu().numpy() right_wrist = keypoints[9] if right_wrist[2] > 0.5: current_y = right_wrist[1] # 判断手是否举起（y坐标变小） if last_hand_position and current_y < last_hand_position - 50: score += 1 print(f"得分: {score}") last_hand_position = current_y # 显示得分 cv2.putText(frame, f"Score: {score}", (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2) # ...（后面的显示代码不变）

4. 项目优化与常见问题

4.1 性能优化技巧

在云端GPU环境下，可以通过以下方法提升性能： - 使用半精度浮点数（FP16）减少计算量：python model = model.half() # 转换为半精度 tensor = tensor.half()- 调整输入图像尺寸（保持长宽比）：python # 缩放图像，长边不超过640像素 height, width = image.shape[:2] scale = 640 / max(height, width) image = cv2.resize(image, (int(width*scale), int(height*scale)))