news 2026/6/24 18:18:47

监督学习非监督学习的区别

张小明

前端开发工程师

1.2k 24

文章封面图 — 监督学习非监督学习的区别

监督学习&非监督学习

监督学习（Supervised Learning）
非监督学习（Unsupervised Learning）
区分——是否有“标签（Label）”
- 什么是「标签」？
- 监督学习（Supervised Learning）
- - 监督学习主要解决两类问题：分类&回归
  - - 分类（Classification）
    - 回归（Regression）
- 非监督学习（Unsupervised Learning）
- - 非监督学习主要做三件事：聚类&降维&异常检测
  - - 聚类（Clustering）
    - 降维（Dimensionality Reduction）
    - 异常检测（Anomaly Detection）
  - 常见监督&非监督学习算法

监督学习（Supervised Learning）

定义：监督学习是指在训练过程中，利用包含输入特征与对应输出标签的数据集，通过最小化预测输出与真实标签之间的误差，学习输入空间到输出空间映射关系的一类机器学习方法。

训练数据形式：
D = { ( x i , y i ) } i = 1 n D = \{(x_i, y_i)\}_{i=1}^nD={(xi,yi)}i=1n

x i x_ixi：输入特征向量
y i y_iyi：已知标签（目标值）

学习目标：
f : X → Y f : X \rightarrow Yf:X→Y
优化目标：经验风险最小化（ERM）

非监督学习（Unsupervised Learning）

定义：非监督学习是指在训练数据不包含任何先验标签信息的情况下，仅利用输入数据的内在结构、统计特性或相似性关系，对数据进行建模和结构发现的一类机器学习方法。

训练数据形式：D = { x i } i = 1 n \mathcal{D} = \{ x_i \}_{i=1}^{n}D={xi}i=1n

无显式目标变量y yy

学习目标：发现数据分布或潜在结构
常见依据：距离度量、相似度函数、概率分布假设

区分——是否有“标签（Label）”

有标签 → 监督学习（Supervised Learning）
没标签 → 非监督学习（Unsupervised Learning）

什么是「标签」？

标签 = 标准答案

数据	是否有标签	说明
房子面积 → 房价	✅ 有	房价就是答案
图片 → 是猫/不是猫	✅ 有	猫 / 非猫
一堆用户购买记录	❌ 没有	没人告诉你“这属于哪一类”

监督学习（Supervised Learning）

定义：给定输入 X 和对应的正确输出 Y，学习 X → Y 的映射关系
📌 核心关键词：有标签

监督学习主要解决两类问题：分类&回归

分类（Classification）

输出是类别

例子：
垃圾邮件 / 非垃圾邮件
肿瘤是良性 / 恶性
是否违约（是 / 否）

回归（Regression）

输出是连续数值

例子：
房价预测
温度预测
股票价格预测

非监督学习（Unsupervised Learning）

定义：只有输入数据 X，没有标准答案 Y，让算法自己发现数据结构
📌 核心关键词：没标签

非监督学习主要做三件事：聚类&降维&异常检测

聚类（Clustering）

👉 把“相似的东西”分到一起

例子：
用户分群
客户画像
文档主题聚类

降维（Dimensionality Reduction）

👉 压缩特征、去冗余、便于可视化

例子：
高维数据 → 2D/3D 可视化
特征压缩

异常检测（Anomaly Detection）

👉 找“不正常”的点

常见监督&非监督学习算法

监督	非监督
线性回归（Linear Regression）——回归	K-means ——聚类
逻辑回归（Logistic Regression） ——分类	层次聚类（Hierarchical Clustering）—— 聚类
KNN（K近邻） —— 分类 / 回归	DBSCAN —— 聚类 / 异常检测
支持向量机（SVM） ——分类 / 回归	PCA（主成分分析） —— 降维
决策树（Decision Tree） ——分类 / 回归	ICA —— 降维
随机森林（Random Forest） —— 分类 / 回归	AutoEncoder ——降维
神经网络（ANN / CNN / RNN） ——分类 / 回归	Apriori —— 关联规则

对比点	监督学习	非监督学习
是否有标签	✅ 有	❌ 没有
是否有标准答案	有	没有
目标	预测结果	发现结构
常见任务	分类、回归	聚类、降维
学习难度	相对简单	相对抽象
现实场景	标签贵	数据多但没标签

版权声明: 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系邮箱：809451989@qq.com进行投诉反馈，一经查实，立即删除！

网站建设 2026/6/23 23:54:16

41、打造出色的 UNIX 系统管理员简历

打造出色的 UNIX 系统管理员简历在竞争激烈的就业市场中，一份出色的简历是开启理想工作之门的关键。对于 UNIX 系统管理员而言，如何准备一份能吸引潜在雇主目光的简历，是迈向成功职业生涯的重要一步。简历的基本维护在当前工作岗位上，要持续更新简历。当参与新项目、…

作者头像

李华

网站建设 2026/6/24 6:00:05

39、Linux Shell 高级特性与技巧解析

Linux Shell 高级特性与技巧解析 1. 数组相关操作在处理数组时，有时需要对数组元素的输出进行排序。由于数组元素扩展后的结果通常是无序的，所以可以将循环的整个输出通过管道传递给 sort 命令来实现排序。另外，使用 ${!array[@]} 扩展可以得到数组索引列表，而不是数…

作者头像

李华

网站建设 2026/6/24 13:42:06

Java设计模式系列 - 基本概念

基本思想设计模式是软件开发中经过反复验证的、解决特定问题的优秀解决方案模板。在Java开发中，设计模式不仅是一种编程技巧，更是提高代码质量、可维护性和可扩展性的重要工具。使用设计模式的主要目的是为了重用代码、让代码更容易被他人理解、保证代码…

作者头像

李华

网站建设 2026/6/23 16:20:15

非专业也能看懂的AI大模型工作原理！（非常详细）从零基础到精通，一篇就够了！

本文全面介绍AI大语言模型工作流程，从文本输入预处理到输出生成全过程。涵盖分词嵌入、Transformer架构、自注意力机制、位置编码及长文本外推等技术，并结合DeepSeek V3实例解析模型如何将语言转换为数学矩阵并生成回答。同时提供丰富的工程实践指导&…

作者头像

李华

网站建设 2026/6/24 21:09:39

前端锚点定位，零基础入门到精通，收藏这篇就够了

一背景知识: 1.1 #号的作用 #代表网页中的一个位置。其右面的字符，就是该位置的标识符。比如，http://www.example.com/index.html#print 就代表网页index.html的print位置。浏览器读取这个URL后，会自动将print位置滚动至可视区域。为网页…

作者头像

李华

网站建设 2026/6/24 22:02:57

AI应用架构师避坑指南：虚拟协作架构中的依赖问题

AI应用架构师避坑指南：虚拟协作架构中的依赖问题——从“木桶效应”到“弹性网络”的进化之路关键词虚拟协作架构、依赖管理、服务耦合、故障隔离、弹性设计、AI应用架构、断路器模式摘要在AI应用规模化落地的今天，虚拟协作架构（由多个分布式服务/模块协同完成复杂任…

作者头像

李华