徐州网站推广,注册网站邮箱发送的验证网页无法打开,免费查看采购信息的平台,外贸网站推广企业本文参考辽宁石油化工大学于晶贤教授的演示文档聚类分析之系统聚类法及其SPSS实现。
目录
1.样品与样品间的距离
2.指标和指标间的“距离”
相关系数
夹角余弦
3.类与类间的距离
#xff08;1#xff09;类间距离
#xff08;2#xff09;类间距离定义方式
1.最短…
本文参考辽宁石油化工大学于晶贤教授的演示文档聚类分析之系统聚类法及其SPSS实现。
目录
1.样品与样品间的距离
2.指标和指标间的“距离”
相关系数
夹角余弦
3.类与类间的距离
1类间距离
2类间距离定义方式
1.最短距离法
2.最长距离法
3.组间平均连接法
4.组内平均连接法
5.重心法
4.常用系统聚类法
系统聚类法过程
5.例子
最短距离系统聚类法
1.写出样品间的距离矩阵(以欧氏距离为例
2.将每一个样品看做是一个类
3.观察 DG2,G4 15.9最小
4.观察 DG6,G7 18.2最小
5.最后将G8与G3聚为一类记为G9
6.该聚类的谱系图
最长距离系统聚类法
1.写出样品间的距离矩阵(以欧氏距离为例
2.将每一个样品看做是一个类
3.观察 DG2,G4 15.9最小
4.观察 DG63,G7 32.4最小
5.最后将G8与G6聚为一类记为G9
6.该聚类的谱系图
其它系统聚类法
聚类分析需要注意的问题
系统聚类法的Spss实现
1.录入数据
2.选择方法
3.统计量和绘制选项
4.方法和保存选项
总结 1.样品与样品间的距离
各种距离如下 最常用的还是绝对值距离特定距离和欧式距离
举例使用如下 2.指标和指标间的“距离”
相关系数 夹角余弦 举例如下 3.类与类间的距离
1类间距离
由一个样品组成的类是最基本的类如果每一类都由一个样品组成那么样品间的距离就是类间距离。
2类间距离定义方式
如果某一类包含不止一个样品那么就要确定类间距离类间距离是基于样品间距离定义的大致有如下几种定义方式
1.最短距离法 2.最长距离法 3.组间平均连接法 4.组内平均连接法 5.重心法 4.常用系统聚类法
系统聚类法过程 5.例子
最短距离系统聚类法 1.写出样品间的距离矩阵(以欧氏距离为例 2.将每一个样品看做是一个类
G1G2G3G4G5观察D(G1,G5) 15.8最小故将G1与G5聚为一类记为G6。
计算新类与其余各类之间的距离得到新的距离矩阵D1 3.观察 DG2,G4 15.9最小
故将G2与G4聚为一类记为G7.
计算新类与其余各类之间的距离得到新的距离矩阵D2 4.观察 DG6,G7 18.2最小
故将G6与G7聚为一类记为G8.
计算新类与其余各类之间的距离得到新的距离矩阵D3 5.最后将G8与G3聚为一类记为G9 6.该聚类的谱系图 最长距离系统聚类法
1.写出样品间的距离矩阵(以欧氏距离为例 2.将每一个样品看做是一个类
即G1G2G3G4G5观察D(G1,G5) 15.8最小故将G1与G5聚为一类记为G6。
计算新类与其余各类之间的距离得到新的距离矩阵D1 3.观察 DG2,G4 15.9最小
故将G2与G4聚为一类记为G7.
计算新类与其余各类之间的距离得到新的距离矩阵D2 4.观察 DG63,G7 32.4最小
故将G3与G7聚为一类记为G8.
计算新类与其余各类之间的距离得到新的距离矩阵D3 5.最后将G8与G6聚为一类记为G9 6.该聚类的谱系图 其它系统聚类法
1组间平均连接系统聚类法 2重心系统聚类法 3组内平均连接系统聚类法 注这些方法的差别就是在计算新类与其余各类间的距离 如需学习详细内容可参考多元统计分析相关书籍。 参考教材《多元统计分析》何晓群中国人民大学出版社2008. 《多元统计分析》于秀林中国统计出版社2006. 聚类分析需要注意的问题
1对于一个实际问题要根据分类的目的来选取指标指标选取的不同分类结果一般也不同。 2样品间距离定义方式的不同聚类结果一般也不同。 3聚类方法的不同聚类结果一般也不同尤其是样品特别多的时候。最好能通过各种方法找出其中的共性。 4要注意指标的量纲量纲差别太大会导致聚类结果不合理。 5聚类分析的结果可能不令人满意因为我们所做的是一个数学的处理对于结果我们要找到一个合理的解释。 系统聚类法的Spss实现
1.录入数据 2.选择方法 3.统计量和绘制选项 4.方法和保存选项 总结
知识点较多但是一通百通具体大家可以参考于晶贤老师的具体内容。
ヾ(▽)Bye~Bye~