python 变量聚类 proc varclus_实验报告八-SAS聚类分析与判别分析.doc
实验报告八-SAS聚类分析与判别分析实 验 报 告实验项目名称聚类分析与判别分析所属课程名称统计分析及SAS实现实 验 类 型验证性实验实 验 日 期2016-12-19班级数学与应用数学学号姓名成绩实验概述:【实验目的及要求】掌握SAS中根据样本或变量按照其性质上的亲疏、相似程度进行聚类分析...
实验报告八-SAS聚类分析与判别分析
实 验 报 告
实验项目名称 聚类分析与判别分析
所属课程名称 统计分析及SAS实现
实 验 类 型 验证性实验
实 验 日 期 2016-12-19
班 级 数学与应用数学
学 号
姓 名
成 绩
实验概述:【实验目的及要求】
掌握SAS中根据样本或变量按照其性质上的亲疏、相似程度进行聚类分析的方法以及判别样品所属类型的判别分析的方法。掌握SAS系统中编程实现聚类分析与判别分析的方法。
【实验原理】
SAS软件的操作方法及原理
【实验环境】(使用的软件)
SAS 9.3
实验内容:【实验方案设计】
理解聚类分析、判别分析的基本概念;
掌握系统聚类法的基本思想和步骤;
掌握判别分析的距离判别法、Fisher判别法和Bayes判别法;
利用编程proc过程步实现系统聚类法与判别分析。
【实验过程】(实验步骤、记录、数据、分析)
【练习8-1】为了更深入了解我国人口文化程度状况,现利用1990年全国人口普查数据对全国30个省、直辖市、自治区进行聚类分析。分析选用了三个指标变量:大学以上文化程度的人口占全部人口的比例(DXBZ),初中文化程度的人口占全部人口的比例(CZBZ),文盲半文盲人口占全部人口的比例(DXBZ),原始数据如表所示。
表 1990年全国人口普查文化程度人口比例
Region
Num
DXBZ
CZBZ
WMBZ
Beijing
1
9.3
30.55
8.7
Tianjing
2
4.67
29.38
8.92
Hebei
3
0.96
24.69
15.21
Shanxi
4
1.38
29.24
11.3
Neimeng
5
1.48
25.47
15.39
Liaoning
6
2.6
32.32
8.81
Jilin
7
2.15
26.31
10.49
Heilongj
8
2.14
28.46
10.87
Shanghai
9
6.53
31.59
11.04
Jiangsu
10
1.47
26.43
17.23
Zhejiang
11
1.17
23.74
17.46
Anhui
12
0.88
19.97
24.43
Fujian
13
1.23
16.87
15.63
Jiangxi
14
0.99
18.84
16.22
Shandong
15
0.98
25.18
16.87
Henan
16
0.85
26.55
16.15
Hubei
17
1.57
23.16
15.79
Hunan
18
1.14
22.57
12.1
Guangdong
19
1.34
23.04
10.45
Guangxi
20
0.79
19.14
10.61
Hainan
21
1.24
22.53
13.97
Sichuan
22
0.96
21.65
16.24
Guizhou
23
0.78
14.65
24.27
Yunnan
24
0.81
13.85
25.44
Xizang
25
0.57
3.85
44.43
Shanxi
26
1.67
24.36
17.62
Gansu
27
1.1
16.85
27.93
Qinghai
28
1.49
17.76
27.7
Ningxia
29
1.61
20.27
22.06
Xinjjiang
30
1.85
20.66
12.75
【解答】
①利用proc cluster过程步实现聚类分析:
libname lmf "E:\sas homework\lmf";
proc cluster data=Lmf.p81 standard method=ward
outtree=Lmf.tree1 pseudo;
var DXBZ CZBZ WMBZ;
copy Region;
run;
结果:
表8.1 Ward's Minimum Variance Cluster Analysis
Eigenvalues of the Correlation Matrix
Eigenvalue
Difference
Proportion
Cumulative
1
210.7398
0.7398
2
000.2103
0.9501
3
00.0499
1.00

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)