ResNet18迁移学习教程：云端GPU快速微调自定义模型-深圳市維司達科技有限公司

ResNet18迁移学习教程：云端GPU快速微调自定义模型

引言

想象一下，你刚成立了一家智能安防创业公司，需要开发一个能识别特定物品（比如消防器材）的AI系统。但手头只有几百张标注图片，从头训练一个深度学习模型简直是天方夜谭。这时候，迁移学习就像给你的AI系统装上了"知识加速器"——它能让小公司也能用上大模型的能力。

ResNet18正是这样一个适合创业团队的"轻量级冠军选手"。作为经典的卷积神经网络，它只有1800万参数（相比ResNet50的2500万更省资源），但通过残差连接结构，在ImageNet上能达到69.7%的top-1准确率。更重要的是，它的预训练权重已经学会了识别通用物体特征，我们只需要用少量数据微调最后几层，就能让它成为专属于你的物品识别专家。

本教程将带你在云端GPU环境下，用PyTorch完成以下实战： 1. 用CSDN算力平台预置的PyTorch镜像快速搭建环境 2. 准备自己的物品识别数据集 3. 巧妙冻结大部分网络层，只训练关键部分 4. 调整学习率等参数获得最佳效果 5. 导出模型用于实际部署

整个过程就像教一个经验丰富的画家改画新题材——不需要从素描基础教起，只需调整最后的创作风格。即使你只有Python基础，跟着步骤也能在1小时内完成模型微调。

1. 环境准备：5分钟搭建GPU训练场

首先我们需要一个带GPU的云环境。传统方式需要自己安装CUDA、PyTorch等依赖，过程繁琐容易出错。推荐使用CSDN算力平台预置的PyTorch镜像，已经配置好所有必要组件。

1.1 选择合适镜像

在CSDN镜像广场搜索"PyTorch"，选择包含以下特性的镜像： - PyTorch 1.12+ 版本 - CUDA 11.6 运行时支持 - 预装torchvision等视觉库 - 可选：Jupyter Notebook支持（适合交互式开发）

对于ResNet18微调，建议选择至少16GB内存的GPU实例（如NVIDIA T4），训练中小型数据集完全够用。

1.2 启动实例并验证环境

连接实例后，运行以下命令验证环境：

# 检查GPU是否可用 python -c "import torch; print(torch.cuda.is_available())" # 查看PyTorch版本 python -c "import torch; print(torch.__version__)" # 检查CUDA版本 python -c "import torch; print(torch.version.cuda)"

正常情况应该输出类似：

True 1.12.1+cu116 11.6

2. 数据准备：制作专属数据集

迁移学习的核心是用少量但高质量的数据教会模型新任务。假设我们要识别消防器材（灭火器、消防栓等），按以下步骤准备数据：

2.1 数据采集建议

多角度拍摄：每个物品至少50张不同角度照片
多样背景：包括室内、室外、不同光照条件
负样本：添加20%不包含目标物体的图片
分辨率：统一调整为224x224（ResNet标准输入尺寸）

2.2 数据集结构

按PyTorch推荐的ImageFolder格式组织：

fire_safety_dataset/ ├── train/ │ ├── extinguisher/ # 灭火器图片 │ ├── hydrant/ # 消防栓图片 │ └── negative/ # 非目标物体图片 └── val/ ├── extinguisher/ ├── hydrant/ └── negative/

2.3 数据增强配置

在data_transforms.py中定义增强策略：

from torchvision import transforms train_transform = transforms.Compose([ transforms.RandomResizedCrop(224), transforms.RandomHorizontalFlip(), transforms.ColorJitter(brightness=0.2, contrast=0.2), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]) val_transform = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ])

💡 注意：归一化参数使用ImageNet的均值标准差，这是迁移学习的标准做法

3. 模型微调：巧用预训练权重

3.1 加载预训练模型

import torchvision.models as models # 加载预训练resnet18 model = models.resnet18(weights='IMAGENET1K_V1') # 查看模型结构 print(model)

关键修改输出层，假设我们有3类（灭火器、消防栓、其他）：

import torch.nn as nn num_classes = 3 model.fc = nn.Linear(model.fc.in_features, num_classes)

3.2 冻结底层参数

只训练最后两层（avgpool和fc），大幅减少计算量：

for name, param in model.named_parameters(): if 'fc' not in name and 'avgpool' not in name: param.requires_grad = False

3.3 训练配置

import torch.optim as optim criterion = nn.CrossEntropyLoss() optimizer = optim.SGD(filter(lambda p: p.requires_grad, model.parameters()), lr=0.001, momentum=0.9) # 学习率调度器 scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)

4. 训练与验证：实战代码全解析

4.1 数据加载

from torchvision import datasets train_dataset = datasets.ImageFolder('fire_safety_dataset/train', transform=train_transform) val_dataset = datasets.ImageFolder('fire_safety_dataset/val', transform=val_transform) train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=32, shuffle=True, num_workers=4) val_loader = torch.utils.data.DataLoader(val_dataset, batch_size=32, shuffle=False, num_workers=4)

4.2 训练循环

def train_model(model, criterion, optimizer, scheduler, num_epochs=25): for epoch in range(num_epochs): # 训练阶段 model.train() running_loss = 0.0 for inputs, labels in train_loader: inputs = inputs.to(device) labels = labels.to(device) optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step() running_loss += loss.item() scheduler.step() # 验证阶段 model.eval() val_loss = 0.0 corrects = 0 with torch.no_grad(): for inputs, labels in val_loader: inputs = inputs.to(device) labels = labels.to(device) outputs = model(inputs) val_loss += criterion(outputs, labels).item() _, preds = torch.max(outputs, 1) corrects += torch.sum(preds == labels.data) epoch_loss = running_loss / len(train_loader) epoch_acc = corrects.double() / len(val_dataset) print(f'Epoch {epoch}/{num_epochs} - Loss: {epoch_loss:.4f} Acc: {epoch_acc:.4f}') return model

4.3 启动训练

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") model = model.to(device) model = train_model(model, criterion, optimizer, scheduler, num_epochs=15)

5. 模型优化与部署

5.1 常见调参技巧

学习率：初始0.001，每7个epoch乘以0.1
批量大小：根据GPU内存选择（16/32/64）
早停机制：当验证集准确率连续3个epoch不提升时停止

5.2 模型保存与加载

# 保存完整模型 torch.save(model, 'fire_safety_resnet18.pth') # 保存状态字典（推荐） torch.save(model.state_dict(), 'fire_safety_resnet18_state.pth') # 加载方式 model = models.resnet18() model.fc = nn.Linear(model.fc.in_features, 3) model.load_state_dict(torch.load('fire_safety_resnet18_state.pth'))

5.3 部署推理示例

from PIL import Image def predict(image_path): img = Image.open(image_path) img = val_transform(img).unsqueeze(0).to(device) model.eval() with torch.no_grad(): outputs = model(img) _, preds = torch.max(outputs, 1) class_names = ['extinguisher', 'hydrant', 'negative'] return class_names[preds[0]]