spss的主成分分析主要应用在因子分析里,目的是将原来很多的因素,通过他们内在的相关分析,整合成新的一个或多个相对独立的综合因素,来代表原来散乱的因素例如我们测量客户满意度,设计了10个题目,那数据收集完后,就可以通过因子分析,来看看这10个题目是否能综合成几个因素通过spss的主成分分析,就可以得出相应结果结果可能是其中5个题目的相关显著,可以通过一个因素来归纳这5个因素,另外3个、2个也可以分别组成一个,而且主成分对应的特征值大于1,这样就最后就可以通过3个综合因素来研究和分析客户满意度了
层次分析法:
主成分分析和层次分析两者计算权重的不同,AHP层次分析法是一种定性和定量的计算权重的研究方法,采用两两比较的方法,建立矩阵,利用了数字大小的相对性,数字越大越重要权重会越高的原理,最终计算得到每个因素的重要性。
主成分分析
(1)方法原理及适用场景
主成分分析是对数据进行浓缩,将多个指标浓缩成为几个彼此不相关的概括性指标(主成分),从而达到降维的目的。主成分分析可同时计算主成分权重及指标权重。
(2)操作步骤
使用SPSSAU进阶方法-主成分分析。
如果计算主成分权重,需要用到方差解释率。具体加权处理方法为:方差解释率除累积方差解释率。
比如本例中,5个指标共提取了2个主成分:
主成分1的权重:45135%/69390%=6505%
主成分2的权重:24254%/69390%=3495%
如果是计算指标权重,可直接查看“线性组合系数及权重结果表格”,SPSSAU自动输出了各指标权重占比结果。其计算原理分为三步:
第一:计算线性组合系数矩阵,公式为:loading矩阵/Sqrt(特征根),即载荷系数除以对应特征根的平方根;
第二:计算综合得分系数,公式为:累积(线性组合系数方差解释率)/累积方差解释率,即上一步中得到的线性组合系数分别与方差解释率相乘后累加,并且除以累积方差解释率;
第三:计算权重,将综合得分系数进行归一化处理即得到各指标权重值。
成分矩阵的结果解读:指成分得分系数矩阵,用来计算公共因子得分,两者综合得出权重。
SPSS中的因子分析有三个矩阵:成份矩阵(未旋转)、旋转后的成份矩阵和成份得分矩阵,前两个就是我们俗称的因子载荷矩阵,只是一个旋转,一个不旋转而已。主成分分析中,没有旋转后的成份矩阵,因此只有成份矩阵和成份得分矩阵。
在主成分分析中,计算主成分得分或因子得分时,需要使用的是第一个矩阵(未旋转的成份矩阵)的系数除以对应成份特征根的平方根作为指标的系数权重。
若矩阵存在个线性无关特征向量,那么可以分解为 。这里是由个特征向量组成的方阵,是由个特征值组成的对角矩阵。
若存在非零向量 ,它使得则称为特征值为特征向量。矩阵代表着对向量进行的线性变换,比如拉伸和旋转。从特征值和特征向量的定义来看,如果矩阵对某个向量只进行了拉伸那么这个向量就是特征向量,拉伸的程度就是特征值。
成分矩阵的特征分解:
当是一个实对称矩阵时,特征分解得到的特征向量正交,对特征向量标准化处理后成为正交矩阵,这时,也可以写成 。
特征值分解只能用于方矩,而奇异值分解可以对形式的矩阵进行分解。若存在矩阵,通过奇异值分解可以表示为 。
pca主成分分析是一种降维技术,它可用于降低n维数据集的维数,同时保留尽可能多的信息。其中,主成分是我们上面讨论过的“新”独立特征。目标是尽可能多地保留“新”特征,同时删除最不重要的特征。
主成分分析的运作:
获取数据集,计算数据的协方差矩阵,计算特征值和特征向量除以协方差矩阵,选择主成分,从选定的组件构造新的特征数据集。
iris数据集是本文中的目标数据集。数据有4个特征或变量; 或矩阵代数中的4维。并且,1个目标向量显示依赖于4个特征的花的类型。所以,问题在于四维。4D并不多,但会尝试将其缩小为2D以说明PCA。
欢迎分享,转载请注明来源:品搜搜测评网