spss主成分分析的两个背景是:数据相关性的背景和变量之间协方差/相关系数的背景。
1、数据相关性的背景:主成分分析通过计算各个变量的协方差/相关系数,找到可以解释大量数据变化的几个主成分,从而减少数据的复杂性和冗余性。
2、变量之间协方差/相关系数的背景:主成分分析基于一些假设,即假设变量之间有相同的方差,这就需要在运行主成分分析之前对变量进行标准化的处理,消除量纲和标准化单位差异的影响。
SPSS主成分分析的背景涉及到数据相关性和变量之间协方差/相关系数,这为进行数据降维和简化多元变量提供了理论基础。
业务上对特征值维度的要求:
统计学模型:3-15个维度,高维度可能导致维度灾难------理论
机器学习模型:50个维度,速度问题------降维
如何降维:
保留重要的特征,剔除不重要的特征
处理流程:
1经验法
2数据分析法(使用yx相关分析,剔除与y无关的变量)
3经验法+数据分析法(x与x相关分析)
4数据分析法+经验法(逐步回归法)
5主成分分析(因为前四步,已经把重要的变量筛选出来了,不重要的删除了,剩下的变量意义很模糊)
下面使用 bankloan_binning (提取码:78uh)做个案例:
1经验法(通过业务判断age_group是重要的)
2数据分析法
3经验法+数据分析法
下面将使用统计学方法对变量做整合
4数据法+经验法(删除变量)
5主成分分析(若变量个数仍大于15,对整个结果进行压缩)
看spss主成分分析结果图方法。
1、分析数据依次单击spss的分析降维因子分析。
2、降维分析接着,将评价员工能力的五个指标变量添加到变量选项框。
3、变量设置接着,进行分析方法的设置。点击描述分析,在弹出的描述分析设置上,勾选相关性矩阵中的系数。
spss如何做主成分分析 主成分分析的主要原理是寻找一个适当的线性变换: •将彼此相关的变量转变为彼此独立的新变量; •方差较大的几个新变量就能综合反应原多个变量所包含的主要信息; •新变量各自带有独特的专业含义。 住成分分析的作用是: •减少指标变量的个数 •解决多重相关性问题 步骤阅读 工具/原料 spss200 方法/步骤 >01 先在spss中准备好要处理的数据,然后在菜单栏上执行:analyse--dimension reduction--factor analyse。打开因素分析对话框 >02 我们看到下图就是因素分析的对话框,将要分析的变量都放入variables窗口中 >03 点击descriptives按钮,进入次级对话框,这个对话框可以输出我们想要看到的描述统计量 >04 因为做主成分分析需要我们看一下各个变量之间的相关,对变量间的关系有一个了解,所以需要输出相关,勾选coefficience,点击continue,返回主对话框 >05 回到主对话框,点击ok,开始输出数据处理结果 >06 你看到的这第一个表格就是相关矩阵,现实的是各个变量之间的相关系数,通过相关系数,你可以看到各个变量之间的相关,进而了解各个变量之间的关系 >07 第二个表格显示的主成分分析的过程,我们看到eigenvalues下面的total栏,他的意思就是特征根,他的意义是主成分影响力度的指标,一般以1为标准,如果特征根小于1,说明这个主因素的影响力度还不如一个基本的变量。所以我们只提取特征根大于1的主成分。如图所示,前三个主成分就是大于1的,所以我们只能说有三个主成分。另外,我们看到第一个主成分方差占所有主成分方差的469%,第二个占275%,第三个占150%。这三个累计达到了895%。
欢迎分享,转载请注明来源:品搜搜测评网