分层聚类怎么做：SPSSAU软件操作步骤与结果解读-深圳市維司達科技有限公司

一、分层聚类所属模块

分层聚类在SPSSAU中属于【进阶方法】模块。

二、方法概述

分层聚类是一种按对象相似程度逐步归并的聚类方法，适合用于样本分组、客户细分、指标结构探索等场景。它不需要提前完全确定分组关系，能帮助研究者先观察数据之间的接近程度，再判断分成几类更合适。

三、变量设置规则

1. 整体设置要求

分层聚类需要设置1类变量，即分析项，变量类型为定量变量。该方法至少放入3个分析项，最多可放入200个，为必填项。

2. 各类变量设置说明

分析项用于衡量样本之间的差异，是完成聚类划分的核心依据。这里只能放入定量变量，至少需要3项，若少于3项，样本之间的层次差异通常难以充分展开；最多支持200项，适合较丰富的指标场景。

四、参数设置及解释说明

聚类个数

（1）可设置内容

可自行设置希望得到的聚类类别数量，系统默认聚类类别为3。

（2）如何选择

如果研究目的只是做初步分群，先使用默认的3类通常更方便观察整体结构；如果业务上已经有较明确的分层思路，也可以按实际需要调整类别个数。类别数设置过少，可能把差异较大的样本归在一起；类别数设置过多，则会让分组过细，后续解释难度增加。

五、分析结果表格及其解读

分层聚类完成后，通常会输出2张核心结果表，并在存在无效或缺失样本时额外输出1张样本缺失情况汇总表。

1. 表1：聚类项描述分析

该表用于先看各个聚类指标的基础分布情况，包含名称、样本量、最小值、最大值、平均值、标准差、中位数等信息。

（1）核心指标解读

● 名称：用于标识每一个参与聚类的分析项，方便对照各指标的分布特征，本身没有好坏之分。

● 样本量：表示该分析项实际参与统计的样本数量，作用是判断各指标是否基于相同的数据基础进行比较。通常样本量越一致，后续聚类结果越便于解释；若某个指标样本量明显偏少，说明该指标可能存在较多缺失，需要结合样本缺失情况一起看。

● 最小值与最大值：用于展示指标的取值范围，作用是帮助判断不同指标的离散程度和是否存在明显极端值。若范围特别大或与其他指标差异明显，说明该指标可能对聚类分组影响较强。

● 平均值：表示该指标的整体水平，作用是帮助理解样本在该指标上的集中位置。平均值本身没有固定好坏，重点看是否能反映不同指标的总体差异。

● 标准差：用于反映数据波动大小，是判断指标区分能力的重要参考。标准差越大，说明该指标在样本之间差异越明显，对分层聚类更可能有区分作用；如果标准差很小，说明样本在该指标上差异不大，区分类别的帮助可能有限。

● 中位数：表示指标居中的典型水平，作用是辅助判断数据是否受极端值影响。若中位数与平均值接近，通常说明分布较平稳；若两者差异较大，说明数据可能偏态或受少数极端值影响。

2. 表2：聚类类别分布表

该表用于直接呈现每个名称最终被归入哪一类，是判断聚类结果最核心的结果表，包含名称和所属类别两个信息。

● 名称：对应参与分层聚类的对象或样本名称，作用是帮助研究者定位每个对象最终的归类结果。

● 所属类别：表示该对象最终被划入的聚类组别，是判断分类结论的核心依据。它本身没有绝对好坏，关键在于同一类别内的对象是否较为相似、不同类别之间是否具有明显差异。如果同类对象在业务特征上较一致，说明聚类结果更有解释价值。

3. 表3：样本缺失情况汇总

当数据中存在无效或被排除样本时，系统会额外输出该表，用于说明本次分析实际使用了多少样本，包含项、样本数和占比。

（1）核心指标解读

● 有效样本：表示最终真正进入分层聚类分析的数据量，作用是判断结果建立在哪些数据基础上。有效样本占比越高，说明分析结果代表性通常越好；如果占比较低，需要谨慎解读聚类结论。

● 排除无效样本：表示因缺失或无效而未纳入分析的样本数量，作用是提醒研究者关注数据清洗对结果的影响。该数值越少通常越理想；如果占比偏高，说明数据质量可能影响聚类稳定性。

● 总计：表示原始样本总量，作用是与有效样本、排除无效样本一起判断样本保留情况。总计本身没有好坏，但可用于评估有效样本保留比例是否足够。

六、分析结果图表及其解读

分层聚类会输出1个核心图表，即聚类树状图。聚类树状图用于展示各对象从相近到逐步合并的层次过程，能直观看到哪些对象先归为一组、哪些对象之间距离更远。

（1）如何看图

阅读时可先看哪些对象在较早阶段就合并到一起，这通常说明它们相似度较高；如果某些对象要到较后阶段才合并，说明它们与其他对象差异更明显。

（2）如何判断分析结论

如果图中能明显看出若干相对稳定的分支结构，说明数据存在较清晰的层次分组；如果各对象合并过程比较杂乱、分支不够清晰，则说明样本之间的层次差异可能不够明显，需要结合业务背景和类别数设置进一步判断。

以上就是SPSSAU分层聚类方法的相关内容，更深入教程可查看SPSSAU帮助手册、教学视频、疑难解惑等资料。

分层聚类怎么做：SPSSAU软件操作步骤与结果解读

Proteus 8.13 + STM32F103R6：5分钟搞定LED闪烁仿真（附完整工程文件）

【网络安全-防火墙配置】

深入浅出：图解瑞萨RH850 FCL、FDL与EEL在汽车OTA和参数存储中的选型与应用

生成式AI如何革新汽车软件测试？

别再只会用Console线了！华为防火墙三种远程管理方式（Web/Telnet/SSH）保姆级配置指南

198种组合算法+优化Transformer编码器+SHAP分析+新数据预测+多输出！深度学习可解释分析，强烈安利，粉丝必备！