news 2026/5/9 1:33:31

(B站TinyML 教程学习笔记)C11 - Edge Impulse 中的特征选择+C12 - 机器学习全流程管道+C13 - 第一模块复习+C14 - 神经网络入门

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
(B站TinyML 教程学习笔记)C11 - Edge Impulse 中的特征选择+C12 - 机器学习全流程管道+C13 - 第一模块复习+C14 - 神经网络入门

机器学习流水线(10:54 - 15:16)

(10:54)机器学习流水线整体流程

机器学习完整流程:

  1. 收集数据

  2. 特征提取

  3. 模型训练

  4. 模型部署

  5. 推理(Inference)


(11:00)数据收集

深度学习通常需要大量数据。

常见数据格式:

数据类型常见格式
音频WAV
数值型传感器数据CSV
内存数据数组 Array

(11:19)监督学习(Supervised Learning)

监督学习特点:

  • 每个样本都有“标签”

  • 标签用于指导模型学习

例如:

数据标签
左右挥动加速度数据left_right
上下挥动加速度数据up_down

特征提取(11:28 - 12:32)

(11:28)什么是特征提取

原始数据通常不能直接给模型。

需要:

  • 清洗数据

  • 过滤噪声

  • 提取有意义的信息

这个过程叫:

Feature Extraction(特征提取)


(11:39)常见特征

课程中提到:

特征作用
RMS均方根表示整体能量
功率谱查看频率信息
FFT频谱分析振动频率

(11:53)特征与标签必须对应

重点:

原始数据标签是什么,
提取后的特征标签也必须一致。

例如:

原始数据 -> label = "circle" 提取特征后: RMS特征 -> label 仍然是 "circle"

模型训练(12:09 - 12:32)

(12:09)训练过程

模型训练本质:

不断调整内部参数。

训练流程:

输入特征 ↓ 模型预测 ↓ 计算误差 ↓ 反向传播 ↓ 更新参数 ↓ 重复很多次

(12:20)为什么需要很多轮训练

通常需要:

  • 几百轮

  • 几千轮

原因:

模型需要不断修正自己的参数。


参数 vs 超参数(12:37 - 13:54)

这是机器学习里非常重要的概念。


参数(Parameter)

(12:46)什么是参数

参数:

模型内部自动学习得到的数值。

例如:

  • 神经网络权重 Weight

  • 偏置 Bias

这些值:

不需要手动设置。

训练时自动更新。


超参数(Hyperparameter)

(13:10)什么是超参数

超参数:

人为提前设定的配置项。


(13:24)常见超参数

超参数作用
学习率 Learning Rate更新速度
Epoch训练轮数
Batch Size每批数据大小
模型大小网络层数/节点数
特征提取方式RMS/FFT等

(13:34)记忆口诀

手动设置的,基本都是超参数。


模型部署与推理(13:56 - 15:16)

(13:56)模型部署

当模型效果满意后:

可以部署到:

  • 单片机

  • 开发板

  • 嵌入式设备


(14:06)模型本质是什么

模型本质:

就是:

一堆数字 + 数学运算

这些数字:

就是训练得到的参数。


(14:27)把模型理解成函数

模型最简单理解:

输入特征 ↓ 模型函数 ↓ 输出预测结果

推理(Inference)

(14:45)什么是推理

推理:

模型对新数据进行预测。

例如:

新加速度数据 ↓ 提取特征 ↓ 送入模型 ↓ 输出:circle

(15:00)训练和推理必须一致

重点中的重点:

训练时怎么提特征,

部署时必须完全一样。

否则:

模型效果会崩。


数据流思想(15:16 - 15:39)

嵌入式AI通常是:

实时连续数据流。

例如:

传感器 ↓ 实时采样 ↓ 特征提取 ↓ 模型推理 ↓ 输出结果

这就是:

TinyML实时推理


自动化与 ML Ops(15:41 - 17:28)

(15:41)数据采集可以自动化

Edge Impulse支持:

  • API自动上传数据

  • 自动训练

  • 自动化流水线


DevOps 与 ML Ops

(16:06)DevOps

DevOps:

开发 + 运维

目标:

快速稳定交付软件。


(16:41)ML Ops

ML Ops:

机器学习版 DevOps。

新增:

  • 数据科学家

  • 数据管理

  • 模型更新

  • 自动训练

  • 自动部署


(17:00)嵌入式AI未来趋势

未来嵌入式AI:

可能需要:

  • OTA模型更新

  • 云端重新训练

  • 批量设备部署

其实这已经很接近:

AIoT(AI + IoT)

了。


前面课程总结(17:55 - 20:46)

(18:10)AI、机器学习、深度学习区别

关系:

AI └── Machine Learning └── Deep Learning

(18:37)单板机 vs 单片机

类型特点
单板机 SBC性能强,跑Linux
单片机 MCU资源少,低功耗

TinyML主要偏向:

MCU(单片机)


(19:30)为什么需要特征提取

因为:

嵌入式设备算力有限。

不能像大模型一样:

直接吃原始数据。

所以:

必须人工提取有效特征。


(20:04)非常重要的工程经验

老师的经验:

先做出能运行的模型,

再慢慢优化。

这是非常真实的工程思想。

很多新手:

一开始就疯狂调参。

结果:

几个月都没结果。


神经网络入门(21:01 - 29:55)


什么是密集神经网络(21:37)

Dense Neural Network:

全连接神经网络

特点:

每层节点:

和下一层全部连接。


手写数字识别(22:00)

经典案例:

MNIST 手写数字识别。

例如:

识别:

0 1 2 3 4 5 6 7 8 9

监督学习再次出现(22:34)

监督学习需要:

输入 x输出 y
图片数字标签

例如:

图片 -> 0 图片 -> 5

感知器(Perceptron)(23:17)

神经网络最基础单元

类似人工神经元。


图片如何输入神经网络(24:05)

神经网络不能直接理解二维图片。

需要:

二维矩阵 → 一维数组。

例如:

28×28 图片:

28 × 28 = 784

最终:

得到784维输入。


权重 Weight(24:36)

神经网络中的每个感知器都会对输入数据进行数学运算:

给每个输入乘一个权重。

数学形式:

其中:

符号含义
x输入
w权重
b偏置

激活函数(25:15)

作用:

引入非线性

否则:

神经网络就只是:

线性回归。


常见激活函数

激活函数特点
Sigmoid老版本常用
Tanh输出范围-1~1
ReLU现在最常用

神经网络结构(26:29)

三层结构:

输入层 ↓ 隐藏层 ↓ 输出层

(27:40)输出层

手写数字识别:

输出层通常有10个节点。

分别代表:

0~9

每个节点:

输出一个概率。


神经网络训练(28:07)

训练流程:

随机初始化参数 ↓ 输入数据 ↓ 前向传播 ↓ 得到预测 ↓ 计算损失 ↓ 反向传播 ↓ 更新参数 ↓ 重复

前向传播(Forward Propagation)

(28:42)

前向传播:

数据从输入层一路算到输出层。


损失函数(Loss Function)

(29:03)

损失函数:

衡量:

模型错得有多严重

损失越小:

模型越准。


反向传播(Backpropagation)

(29:12)

反向传播核心思想:

“回头改答案”

模型发现:

预测错了。

于是:

沿着网络反方向:

一点点修改参数。

直到:

预测越来越准。


最核心总结(这一大段课程真正的重点)

机器学习本质:

数据 ↓ 特征 ↓ 模型 ↓ 损失 ↓ 反向传播 ↓ 更新参数 ↓ 越来越准

而 TinyML 的核心难点:

不是“训练”。

而是:

如何在极小的MCU资源下,

做出还能跑得动的模型。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 1:32:35

Lontium 的 LT8619C 是一款高性能 HDMI转LVDS+RGB

1. 说明龙迅Lontium 的 LT8619C 是一款高性能 HDMI / 双模 DP 接收器芯片,符合 HDMI 1.4 规范。TTL 输出可支持 RGB、BT656、BT1120,输出分辨率可支持高达 4Kx2K30Hz。 为了便于实现多媒体系统,LT8619C 支持 8 通道高质量 I2S 音频或 SPDIF 音…

作者头像 李华
网站建设 2026/5/9 1:29:31

Cursor AI编程助手深度思考规则:从思维链到工程化实践

1. 项目概述:为AI编程助手注入深度思考的灵魂如果你和我一样,日常重度依赖Cursor这类AI编程助手来写代码、重构项目或者排查问题,那你肯定也遇到过类似的困扰:AI给出的答案有时看起来“很对”,但仔细一琢磨&#xff0c…

作者头像 李华
网站建设 2026/5/9 1:26:27

终极指南:如何永久备份你的微信聊天记录(免费开源方案)

终极指南:如何永久备份你的微信聊天记录(免费开源方案) 【免费下载链接】WeChatExporter 一个可以快速导出、查看你的微信聊天记录的工具 项目地址: https://gitcode.com/gh_mirrors/wec/WeChatExporter 你是否曾经担心过重要的微信聊…

作者头像 李华
网站建设 2026/5/9 1:26:23

Arm Neoverse V3AE缓存与TLB调试机制详解

1. Arm Neoverse V3AE核心内存访问机制深度解析在现代处理器架构中,缓存子系统对系统性能至关重要,但同时也带来了复杂的调试挑战。Arm Neoverse V3AE作为面向基础设施的高性能核心,提供了一套独特的内部内存直接访问机制,让开发者…

作者头像 李华
网站建设 2026/5/9 1:15:30

Tbeas青和生日邮件自动祝福发送系统 一键配置情侣/人事必备

这款Tbeas青和生日邮件自动祝福发送系统是一款轻量化、自动化的生日关怀工具,专为企业人事、社群运营、亲友管理等场景设计,通过定时任务与邮件接口,实现生日祝福邮件的自动抓取、匹配与发送,免去人工逐一发送的繁琐,提…

作者头像 李华
网站建设 2026/5/9 1:10:29

开关电源PCB布局优化与EMI问题解决方案

1. 开关电源PCB布局与EMI问题的本质矛盾十年前我刚接触开关电源设计时,曾天真地认为只要电路原理正确就能通过EMC测试。直到亲眼目睹某工业控制器因DC-DC模块辐射超标导致整机认证失败,才真正理解PCB布局对EMI性能的决定性影响。开关电源本质上是个矛盾体…

作者头像 李华