news 2026/4/23 13:40:19

day22推断聚类后簇的类型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
day22推断聚类后簇的类型

聚类算法四(如 KMeans)本身只会根据特征相似性分组,而不会自动告诉你“这些组代表什么”。因此,需要对聚类Q结果进行解释与命名(簇定义)。
两种确定簇含义的思路:
一、聚类前选定特征(目标导向型)
在开始聚类时就只选取你认为与目标含义相关的特征。例如:要分析“消费者购买习惯”,只使用购买金额、频率、种类等特征,而不使用年龄或行业等无关特征。这样得到的簇,其含义自然与“购买习惯”相关。
二、聚类后再特征选择Q(数据驱动口型)
先用所有特征进行聚类,然后把聚类结果(簇标签)当作“目标变量”,把原始特征作为输入变量。再训练一个监督学习模型(如决策树、随机森林四),通过特征重要性(Feature lmportance)来识别哪些特征最能区分不同簇。注:其核心思想为把聚类结果当标签,再反过来训练监督模型解释它,通过监督学习的可解释性,来反推聚类的结构。总结:聚类的目标不是简单分组,而是要用合适特征构建有意义的簇;通过模型解释或特征重要性识别关键特征;将簇定义为具有业务或科学意义的群体类型。@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 10:48:55

Wan2.2-T2V-A14B如何生成带有弹幕评论的模拟播放界面?

Wan2.2-T2V-A14B如何生成带有弹幕评论的模拟播放界面? 在短视频内容爆炸式增长的今天,用户早已不满足于“看视频”这一单向行为——他们更渴望参与、互动与共鸣。尤其是在B站、抖音等平台上,一条视频是否“火”,往往不是由画质或剧…

作者头像 李华
网站建设 2026/4/23 10:48:44

从零上手MiniCPM 2.0:端侧大模型本地部署全攻略

模型概述:重新定义轻量级AI的性能边界 【免费下载链接】MiniCPM-V-2 项目地址: https://ai.gitcode.com/OpenBMB/MiniCPM-V-2 在大语言模型参数竞赛愈演愈烈的当下,面壁智能与清华大学自然语言处理实验室联合研发的MiniCPM系列,正以&…

作者头像 李华
网站建设 2026/4/23 12:11:53

机器学习——线性回归

介绍线性回归线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法相关关系:包含因果关系和平行关系因果关系:回归分析(原因引起结果,需要明确自变量和因变量&#xff0…

作者头像 李华
网站建设 2026/4/18 10:31:07

ARM 架构中的数据同步屏障(DSB)是什么?

ARM 架构中的数据同步屏障(DSB)是什么? 在 ARM 架构中,数据同步屏障(DSB,Data Synchronization Barrier) 是一种内存屏障(Memory Barrier) 指令,用于确保在屏…

作者头像 李华
网站建设 2026/4/23 13:37:20

Windows右键菜单终极优化:告别杂乱,重获清爽操作体验

Windows右键菜单终极优化:告别杂乱,重获清爽操作体验 【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序 项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 还在为右键菜单中密密麻麻的无用选项…

作者头像 李华