在上一篇文章中,我们探讨了SPSS中的系统聚类分析,其中包括Q型和R型聚类。这些方法主要用于探索数据中可能存在的类别数量,而不是预设具体的类别数。这种方式允许我们从数据中发现潜在的分类模式。回顾之前的内容可以帮助大家更好地理解接下来的分析:
今天,我们将深入了解K-均值聚类,它与系统聚类的不同之处在于,我们对最终的类别数有明确的要求或依据。K-均值聚类适用于我们已经知道要将数据分为固定类别的情况。接下来我们将展示如何应用K-均值聚类方法。
需要注意的是,K-均值聚类方法专门针对样本进行分类。以我们的示例数据为例(见图1),我们的目标是将样本明确地分为三类。
图1
操作步骤:
①点击“分析”--“分类”--“K-均值聚类”(见图2)
图2
②接着,将变量γ1-5移动到右侧变量框,并设置聚类数为“3”(见图3)
图3
③点击“保存”按钮,勾选“聚类成员”选项(见图4)
图4
④然后,点击“选项”,勾选“统计”栏目下的“初始聚类中心”和“每个个案的聚类信息”(见图5),最后点击确定
图5
⑤结果分析
图6
从结果图中可以看到,我们在变量视图中新增了一列,显示了31个样本的新分类。
图7
结果显示,1类包含9个样本,2类包含18个样本,3类包含4个样本。尽管分类已经完成,但这些类别之间的关系是什么呢?我们可以通过查看最终聚类中心来了解(见图8)。
图8
通过最终的聚类中心表,我们可以发现:第3类的γ指标值最高,第1类的指标值中等,而第2类的指标值最低。由此,我们能够快速而准确地将31个样本分为高中低三个类别。
总结一下,K-均值聚类是一种有明确分类目标的方法,与之前讨论的系统聚类的探索性质不同,K-均值聚类要求我们事先确定类别数。希望今天的讲解对大家有所帮助,未来的文章中还将继续更新SPSS的其他课程内容,敬请期待!
本期课程结束,谢谢大家的耐心观看!每日更新,敬请关注!
【杏花开生物医药统计】微信公众号(xhkdata)
【杏花开生物医药统计】相关文章:
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·