Advertisement

欧氏距离系统聚类法

阅读量:

小惠作业 2
例3-4
X1 食品支出(元/人) X5 交通和通讯支出(元/人)
X2 衣着支出(元/人) X6 娱乐、教育和文化服务支出(元/人)
X3 家庭设备、用品及服务支出(元/人) X7 居住支出(元/人)
X4 医疗保健支出(元/人) X8 杂项商品和服务支出(元/人)
X1 X2 X3 X4 X5 X6 X7 X8
辽宁 1772.14 568.25 298.66 352.20 307.21 490.83 364.28 202.50
浙江 2752.25 569.95 662.31 541.06 623.05 917.23 599.98 354.39
河南 1386.76 460.99 312.97 280.78 246.24 407.26 547.19 188.52
甘肃 1552.77 517.16 402.03 272.44 265.29 563.10 302.27 251.41
青海 1711.03 458.57 334.91 307.24 297.72 495.34 274.48 306.45

plot(cost)

1 辽宁 1772.14 568.25 298.66 352.20 307.21 490.83 364.28 202.50
2 浙江 2752.25 569.95 662.31 541.06 623.05 917.23 599.98 354.39
3 河南 1386.76 460.99 312.97 280.78 246.24 407.26 547.19 188.52
4 甘肃 1552.77 517.16 402.03 272.44 265.29 563.10 302.27 251.41
5 青海 1711.03 458.57 334.91 307.24 297.72 495.34 274.48 306.45

使用readtable函数读取文件路径为'D:/data/cost.txt'的制表分隔文本文件,并设置读取时的分隔符为制表符且带有列名

从工作空间中删除变量名为data1的对象

对变量cost进行操作后去除第一列数据

调用View函数查看数据框cost

移除第一列

X1 X2 X3 X4 X5 X6 X7 X8
1 1772.14 568.25 298.66 352.20 307.21 490.83 364.28 202.50
2 2752.25 569.95 662.31 541.06 623.05 917.23 599.98 354.39
3 1386.76 460.99 312.97 280.78 246.24 407.26 547.19 188.52
4 1552.77 517.16 402.03 272.44 265.29 563.10 302.27 251.41
5 1711.03 458.57 334.91 307.24 297.72 495.34 274.48 306.45
as.matrix(cost)
X1 X2 X3 X4 X5 X6 X7 X8
[1,] 1772.14 568.25 298.66 352.20 307.21 490.83 364.28 202.50
[2,] 2752.25 569.95 662.31 541.06 623.05 917.23 599.98 354.39
[3,] 1386.76 460.99 312.97 280.78 246.24 407.26 547.19 188.52
[4,] 1552.77 517.16 402.03 272.44 265.29 563.10 302.27 251.41
[5,] 1711.03 458.57 334.91 307.24 297.72 495.34 274.48 306.45

dist(cost, method=Euclid, diag=TRUE, upper=TRUE) 观察欧式距离的结果显示:将编号为一和五的样本归为一类;接着将编号为一五四的样本归为另一类;最后再加入编号为二、三的样本进行分析。

复制代码
      1         2         3         4         5

1 0.0000 1220.1331 457.9092 284.6016 195.1401
2 1220.1331 0.0000 1580.6879 1390.7113 1284.7126
3 457.9092 1580.6879 0.0000 356.7991 452.7967
4 284.6016 1390.7113 356.7991 0.0000 208.9018
5 195.1401 1284.7126 452.7967 208.9018 0.0000

hc<-hclust(dist(cost),“single”)最短距离法。
plot(hc)

在这里插入图片描述

em…改天有时间自己写函数。

全部评论 (0)

还没有任何评论哟~