实验报告八-SAS聚类分析与判别分析

实 验 报 告

实验项目名称 聚类分析与判别分析

所属课程名称 统计分析及SAS实现

实 验 类 型 验证性实验

实 验 日 期 2016-12-19

班 级 数学与应用数学

学 号

姓 名

成 绩

实验概述:【实验目的及要求】

掌握SAS中根据样本或变量按照其性质上的亲疏、相似程度进行聚类分析的方法以及判别样品所属类型的判别分析的方法。掌握SAS系统中编程实现聚类分析与判别分析的方法。

【实验原理】

SAS软件的操作方法及原理

【实验环境】(使用的软件)

SAS 9.3

实验内容:【实验方案设计】

理解聚类分析、判别分析的基本概念;

掌握系统聚类法的基本思想和步骤;

掌握判别分析的距离判别法、Fisher判别法和Bayes判别法;

利用编程proc过程步实现系统聚类法与判别分析。

【实验过程】(实验步骤、记录、数据、分析)

【练习8-1】为了更深入了解我国人口文化程度状况,现利用1990年全国人口普查数据对全国30个省、直辖市、自治区进行聚类分析。分析选用了三个指标变量:大学以上文化程度的人口占全部人口的比例(DXBZ),初中文化程度的人口占全部人口的比例(CZBZ),文盲半文盲人口占全部人口的比例(DXBZ),原始数据如表所示。

表 1990年全国人口普查文化程度人口比例

Region

Num

DXBZ

CZBZ

WMBZ

Beijing

1

9.3

30.55

8.7

Tianjing

2

4.67

29.38

8.92

Hebei

3

0.96

24.69

15.21

Shanxi

4

1.38

29.24

11.3

Neimeng

5

1.48

25.47

15.39

Liaoning

6

2.6

32.32

8.81

Jilin

7

2.15

26.31

10.49

Heilongj

8

2.14

28.46

10.87

Shanghai

9

6.53

31.59

11.04

Jiangsu

10

1.47

26.43

17.23

Zhejiang

11

1.17

23.74

17.46

Anhui

12

0.88

19.97

24.43

Fujian

13

1.23

16.87

15.63

Jiangxi

14

0.99

18.84

16.22

Shandong

15

0.98

25.18

16.87

Henan

16

0.85

26.55

16.15

Hubei

17

1.57

23.16

15.79

Hunan

18

1.14

22.57

12.1

Guangdong

19

1.34

23.04

10.45

Guangxi

20

0.79

19.14

10.61

Hainan

21

1.24

22.53

13.97

Sichuan

22

0.96

21.65

16.24

Guizhou

23

0.78

14.65

24.27

Yunnan

24

0.81

13.85

25.44

Xizang

25

0.57

3.85

44.43

Shanxi

26

1.67

24.36

17.62

Gansu

27

1.1

16.85

27.93

Qinghai

28

1.49

17.76

27.7

Ningxia

29

1.61

20.27

22.06

Xinjjiang

30

1.85

20.66

12.75

【解答】

①利用proc cluster过程步实现聚类分析:

libname lmf "E:\sas homework\lmf";

proc cluster data=Lmf.p81 standard method=ward

outtree=Lmf.tree1 pseudo;

var DXBZ CZBZ WMBZ;

copy Region;

run;

结果:

表8.1 Ward's Minimum Variance Cluster Analysis

Eigenvalues of the Correlation Matrix

Eigenvalue

Difference

Proportion

Cumulative

1

210.7398

0.7398

2

000.2103

0.9501

3

00.0499

1.00

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐