spss因子分析综合评价公式_《谁说菜鸟不会数据分析SPSS篇》读书笔记4
目录:RFM分析聚类分析因子分析对应分析一.RFM分析RFM是一种探索性分析方法,是根据客户活跃程度和交易金额贡献进行客户价值细分的一种方法。RFM分析用R、F、M三个指标构成三维立方图,在各自维度上用高、低两个类将立方图剖开,这样根据不同的分类组合形成了8种客户类型。(R:客户最近一次交易时间的间隔;F:客户在最近一段时间内交易的次数;M:客户在最近一段时间内交易的金额。)RFM分析接收的数据格
目录:
RFM分析
聚类分析
因子分析
对应分析
一.RFM分析
RFM是一种探索性分析方法,是根据客户活跃程度和交易金额贡献进行客户价值细分的一种方法。RFM分析用R、F、M三个指标构成三维立方图,在各自维度上用高、低两个类将立方图剖开,这样根据不同的分类组合形成了8种客户类型。(R:客户最近一次交易时间的间隔;F:客户在最近一段时间内交易的次数;M:客户在最近一段时间内交易的金额。)
RFM分析接收的数据格式有两种:1.交易数据:每次交易占一行,关键变量是客户ID、交易日期和交易金额。2.客户数据:每个客户占一行,关键变量是客户ID、交易总金额,交易总次数最近交易日期。为保证数据的精确性,建议采用交易数据格式进行分析。
RFM分析SPSS操作方法:单击【分析】菜单,选择【直销】——【选择技术】,在弹出的对话框中单击【了解我的联系人】下方第一个方框【帮助确定我的最佳联系人(RFM分析)】,然后单击【继续】弹出数据格式选择对话框,根据数据文件选择数据格式(交易数据或客户数据)再单击【继续】弹出新的对话框,在对话框【变量】选项卡下将各个变量移至它们对应的变量框,在【输出】选项卡下勾选全部选项单击【确定】。操作完成后会生成一个新的数据文件记录最近一次交易日期、交易总金额,交易总次数和RFM各项的分值等,将其保存。
RFM分析应用方法:1.先使用【分析】——【描述统计】——【描述】计算出RFM各项得分值的均值(R_SF_SM_S的均值);2.再使用【转换】——【重新编码为不同变量】以各自平均值为界将R_SF_SM_S分组为高低两类,得到值为1(高)和2(低)的变量R_S分类F_S分类M_S分类;3.利用【转换】——【计算变量】生成“客户分类”变量,值为1~8:在【目标变量】框中输入“客户分类”,在数字表达式中依次输入1~8,在单击【如果】弹出的对话框中对应输入R_S分类F_S分类M_S分类三个变量值的8个不同组合,定义8种客户类型;4.单击【数据】——【定义变量属性】输入与“客户分类”变量值对应的客户类型标签。
二.聚类分析
聚类分析就是按照个体的特征将它们分类,目的在于让同一个类别内的个体之间具有较高的相似度,不同类别之间具有较大的差异性。聚类分析有四步:确定需要参与聚类分析的变量,对数据进行标准化处理,选择聚类方法和类别个数,聚类分析结果解读。常用的聚类方法有三种:快速聚类,系统聚类,二阶聚类。
(1)快速聚类分析
快速聚类也称K均值聚类,按一定方法选取一批聚类中心点,让个案向最近的聚类中心点聚集形成初始分类,再按最近距离原则调整不合理的分类,直到分类合理为止。
SPSS操作方法:单击【分析】——【分类】——【K-均值聚类】,将合适的字段拖入【变量】和【个案标注依据】框中,在【聚类数】中输入期望的分类数,再单击【保存】按钮打开对话框勾选【聚类成员】用以保存聚类的分组。快速聚类完成后数据文件会生成一个变量,变量值表示每个个案所处的类别。将这个分类结果与参与聚类分析的变量制作交叉表计算平均值,了解每个类别的特征。
(2)系统聚类分析
系统聚类也称层次聚类,首先将参与聚类的个案(或变量)各视为一类,然后根据两个类别之间的距离或相似性逐步合并,直到所有个案(或变量)合并为一个大类为止。
SPSS操作方法::单击【分析】——【分类】——【系统聚类】,将合适的字段拖入【变量】和【个案标注依据】框中,单击右侧的【统计】按钮设置所要生成类别的个数(可输入单个分类数量也可输入分类数量的范围);单击【图】按钮勾选【谱系图】同时在【冰柱图】下方选择【无】(谱系图即树状图,比冰柱图更为直观);单击【方法】按钮设置【聚类方法】(常用【组间联接】和【瓦尔德法】),针对不同数据类型选用不同的测量方法(【区间】适用于连续变量,通常选择【平方欧式距离】;【计数】适用于连续或分类变量,通常选择【卡方测量】;【二元】适用于0/1分类变量,,通常选择【平方欧式距离】),【标准化】一般采用【Z得分】;单击【保存】按钮根据之前【统计】的设置设置同样的统计类别。系统聚类完成后,数据文件会按之前设置的类别值范围生成多个分类变量(按3类分的变量,按4类分的变量.....),将这个分类结果与参与聚类分析的变量制作交叉表计算平均值,了解每个类别的特征。
(3)二阶聚类分析
二阶聚类也称两步聚类,整个聚类过程分成两个步骤:1.预聚类:根据定义的最大类别数对个案进行初步分类;2.正式聚类:对第一步中得到的初步分类进行再聚类并确定最终聚类结果且在这一步中根据一定的统计标准确定聚类的类别数。
SPSS操作方法::单击【分析】——【分类】——【二阶聚类】,将分类变量拖至【分类变量】框中,将连续变量拖至【连续变量】框中,单击【输出】按钮在打开的对话框中勾选【透视表】和【创建聚类成员】。
三.因子分析
因子分析通过研究变量间的相关关系矩阵,把变量间错综复杂的关系归结成少数几个综合因子并据此对变量进行分类的分析方法。因归结出的因子个数少于原始变量个数,但它们又包含了原始变量的信息,所以也称这一分析过程为降维。因子分析有四个步骤:判断数据是否适合因子分析,构造因子变量,利用因子旋转方法使因子更具实际意义,计算每个个案因子得分。
适合因子分析的数据判断标准:1.因子分析的变量要求为连续变量,分类变量不合适直接进行因子分析;2.建议个案个数为变量个数的5倍以上;3.KMO检验统计量在0.5以下不合适做因子分析,在0.7以上较适合做因子分析,在0.8以上时说明极其适合做因子分析。
因子载荷:每个原始变量和每个因子之间的相关系数,反映了变量对因子的重要性;变量共同度:每个变量所包含的信息能被因子解释的程度,取值范围介于0和1之间,取值越大程度越高;因子旋转:对因子载荷矩阵旋转可使原始变量和因子之间的关系更加突出,易于解释因子的含义;因子得分:用于评价每个个案在每个因子上的分值,由原始变量和因子之间的关系计算得到且经过标准化。
SPSS操作方法:单击【分析】——【降维】——【因子】,将待分析的变量移至【变量】框中,单击【描述】按钮打开对话框勾选【KMO和巴特利特球形度检验】用于生成检验因子分析适合度的统计指标;单击【提取】按钮打开对话框在【方法】下拉框选择【主成分】作为提取因子的方法,在【输出】下勾选【碎石图】用于辅助判断因子个数;单击【旋转】按钮打开对话框在【方法】框选择【最大方差法】用于更好地解释因子所包含的意义(最大方差法可使每个变量尽可能地在一个因子上有较高的载荷,在其余的因子上载荷较小);单击【得分】按钮打开对话框勾选【保存为变量】并在下面的方法框中选择【回归】项用于保存计算得到的因子得分;单击【选项】按钮打开对话框勾选【系数显示格式】下的【按大小排序】和【排除小系数】,在【绝对值如下】框中输入“.40"表示将变量按对因子的载荷大小从高到低排序并限制输出低于0.4的因子载荷。数据文件中会生成因子得分变量。
确定提取因子个数的标准有:初始特征值大于1的因子个数;累积方差贡献率达到一定水平(如60%)的因子个数;碎石图中处于较陡曲线上所对应的因子个数;依据对研究事物的理解而指定因子个数
通过因子得分进行综合评价:以旋转后每个因子的方差贡献率占总累积方差贡献率的比例作为权重进行加权计算。利用【转换】——【计算变量】,在【数学表达式】框中输入加权计算公式,在【目标变量】框输入“综合得分”即可生成一个综合得分变量。
四.对应分析
对应分析主要用于研究分类变量构成的交叉表以揭示变量间的关系,并将交叉表的信息以图形的方式展示出来。对应分析的原理与步骤:1.将两个分类变量做成交叉表格式,交叉表中的每个单元格可以看作变量在相应类别上的对应点;2.对应分析把变量与变量间的联系同时反映在一张图形上(通常平面图形)使联系密切的类别点较集中,联系疏远的类别点较分散;3.通过观察对应图就能直观地把握变量与类别之间的联系。
对应分析操作方法:1.先把交叉表转换成一维表:在EXCEL中用数据透视表的【多重合并计算数据区域】;2.对个案进行加权:将转换后的一维表导入SPSS,单击【数据】——【个案加权】,选择【个案加权系数】,将“数值”变量移至【频率变量】框中即可;3.单击【分析】——【降维】——【对应分析】,将两个分类变量移至【行】【列】框中,并单击各自下方的【定义范围】按钮定义行和列的范围。
评估对应分析图的解释能力:如果前两个维度的累积惯量比例不低于80%则说明该图效果较好。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)