news 2026/5/1 6:53:53

7.1 机器学习基本框架:数据、假设空间、学习算法与评估

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
7.1 机器学习基本框架:数据、假设空间、学习算法与评估

7.1 机器学习基本框架:数据、假设空间、学习算法与评估

机器学习赋予计算机从经验数据中学习并改进其性能的能力,而无需进行明确的、基于规则的编程。其所有理论与应用均建立在一个统一的形式化框架之上,该框架包含四个核心要素:数据假设空间学习算法评估。本节旨在系统阐述这一基本框架的逻辑内涵及其相互作用,为深入理解后续章节的各类模型与算法奠定基础。

7.1.1 数据:学习的源头与基础

数据是机器学习过程的起点与驱动力。通常,一个数据集D DDm mm个独立同分布的样本构成,每个样本由一个特征向量x i \mathbf{x}_ixi和一个可能的标签y i y_iyi组成,记为D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x m , y m ) } D = \{(\mathbf{x}_1, y_1), (\mathbf{x}_2, y_2), ..., (\mathbf{x}_m, y_m)\}D={(x1,y1),(x2,y2),...,(xm,ym)}

7.1.1.1 特征与表示

特征向量x i ∈ X \mathbf{x}_i \in \mathcal{X}xiX是对现实世界对象或事件的数字化表示,其所在集合X \mathcal{X}X称为特征空间。特征工程的目标是构造一个能够有效支撑学习任务的X \mathcal{X}X。例如,在图像识别中,x i \mathbf{x}_ixi可能是一个由像素值组成的张量;在自然语言处理中,它可能是一个词袋向量或词嵌入序列。特征的质量直接影响学习任务的性能上限,即“垃圾进,垃圾出”原则。

7.1.1.2 标签与任务定义

标签y i ∈ Y y_i \in \mathcal{Y}yiY定义了学习的目标。根据Y \mathcal{Y}Y的形式,机器学习任务主要分为:

  • 监督学习Y \mathcal{Y}Y是一个离散的有限集合(分类)或连续区间(回归)。例如,手写数字识别中y i ∈ { 0 , 1 , . . . , 9 } y_i \in \{0,1,...,9\}yi{0,1,...,9},房价预测中y i ∈ R + y_i \in \mathbb{R}^+
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 10:55:28

7.2 学习范式的分类:监督、无监督、半监督、自监督与强化学习

7.2 学习范式的分类:监督、无监督、半监督、自监督与强化学习 机器学习并非一个单一的方法论,而是根据学习过程中可利用的信息类型和目标形式,分化出的多种学习范式。每种范式对应着不同的数据假设、问题定义和算法体系。清晰地理解这些范式的区别与联系,是选择适当方法解…

作者头像 李华
网站建设 2026/4/30 17:55:23

广西对外农业投资规模稳增 民营企业成主力军

中新社南宁12月10日电 (杨陈 莫舒华)广西农业外资项目管理中心10日介绍,今年以来,广西对外农业投资新增逾376.3万美元,民营企业成为海外拓展的主力军;投资区域包括共建“一带一路”国家及《区域全面经济伙伴关系协定》(RCEP)成员国…

作者头像 李华
网站建设 2026/5/1 20:04:05

【毕业设计】SpringBoot+Vue+MySQL 考试系统平台源码+数据库+论文+部署文档

💡实话实说:有自己的项目库存,不需要找别人拿货再加价,所以能给到超低价格。摘要 随着信息技术的快速发展,传统考试模式正面临效率低下、管理成本高、数据安全性不足等问题。在线考试系统作为一种新型的考试管理模式&a…

作者头像 李华
网站建设 2026/4/30 14:02:56

Opencv在Visual Studio中的配置使用

我打开的是一个 C#/.NET 8.0 的控制台项目,所以配置 OpenCV 推荐用 OpenCVSharp(OpenCV 的 C# 封装库),步骤非常简单:配置步骤(C#/.NET 8.0 项目)打开 NuGet 包管理器右键项目 → 选择「管理 Nu…

作者头像 李华
网站建设 2026/4/23 14:45:21

服务器部署的优雅艺术

GitHub 主页 作为一名有 40 年开发经验的老兵,我依然清晰地记得那个周五的午夜。我本该在家享受周末,却身处冰冷的机房,耳边是服务器风扇的嗡嗡声,眼前是终端上不断滚动的错误日志。一次本应"简单"的版本更新&#xff0…

作者头像 李华