1、根据特征方程求出各个特征值,λ是特征值,I代表单位矩阵,R是各个变量所形成的的相关矩阵,相关矩阵可以通过spss的相关命令求得,然后可以解出λ。
2、用求得的特征值λ,相关矩阵R这些条件,求出对应于特征值的特征向量e(i)(根据特征向量的求解方程RE=λE求出每个特征值的特征向量),所有的e(i)所形成的的矩阵就是Component Matrix 主成分矩阵,每个e(i)代表了每个主成分和每个变量的相关。
这个主成分系数矩阵要自己手算很麻烦的,知道大致的原理就可以了
EF-Tu、EF-Ts以及EF-G(其中EF-Tu和EF-Ts可以复合为EF-T)3个原始因子。基于主成分模型的主成分分析法、基于因子分析模型的主轴因子法、极大似然法、最小二乘法、a因子提取法、映像分析法。主成分分析法能够为因子分析提供初始解,因子分析是主成分分析结果的延伸和拓展。
扩展资料:
在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。
和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。
而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这种情况也可以使用因子得分做到。所以这种区分不是绝对的。
-因子分析法
在科学研究或日常生活中,
常常需要判断某一事物在同类事物中的好坏、
优劣程度及其发展规律等问题。而影响事物的特征及 其发展规律的因素(指标)是多方面的,因此,
在对该事物进行研究时,为了能更全面、
准确地反映出它的特征及其发展规律,
就不应仅从单个指标或单方面去评价 它,而应考虑到与其有关的多方面的因素,
即研究中需要引入更多的与该事物有关系的变量,
来对其进行综合分析和评价。
多变量大样本资料无疑能给研究人员或决 策者提供很多有价值的信息,但在分析处理多变量问题时,
由于众变量之间往往存在一定的相关性,
使得观测数据所反映的信息存在重叠现象。因此为了尽量避免信 息重叠和减轻工作量,
人们就往往希望能找出少数几个互不相关的综合变量来尽可能地反映
原来数据所含有的绝大部分信息。
而主成分分析和因子分析正是为解决此 类问题而产生的多元统计分析方法。
近年来,这两种方法在社会经济问题研究中的应用越来越多,
其应用范围也愈加广泛。因子分析是主成分 分析的推广和发展,二者之间就势必有着许多共同之处,而 SPSS不能直接进行主成分分析,
致使一些应用者在使用SPSS进行这两种方法的分析时,
常常会出现一些混淆性的错误,这难免会使人们对分析结果产生 质疑。因此,有必要在运用SPSS分析时,
将这两种方法加以严格区分,并针对实际问题选择正确的方法。
二、主成分分析与因子分析的联系与区别
两种方法的出发点都是变量的相关系数矩阵,
在损失较少信息的前提下,把多个变量(
这些变量之间要求存在较强的相关性,
以保证能从原始变量中提取主成分) 综合成少数几个综合变量来研究总体各方面信息的多元统计方法,
且这少数几个综合变量所代表的信息不能重叠,即变量间不相关。
主要区别:
主成分分析是通过变量变换把注意力集中在具有较大变差的那些主成
分上,而舍弃那些变差小的主成分;
因子分析是因子模型把注意力集中在少数不可观测的潜在变量(
即公共因子)上,而舍弃特殊因子。
2 主成分分析是将主成分表示为原观测变量的线性组合,
(1)
主成分的个数i=原变量的个数p,其中j=1,2,…,p,是相关矩阵的特征值所对应的特征向量矩阵中的元素, 是原始变量的标准化数据,均值为0,方差为1。
其实质是p维空间的坐标变换,不改变原始数据的结构。
而因子分析则是对原观测变量分解成公共因子和特殊因子两部分。
因子模型如式(2),
(2)
其中i=1,2,…,p, m
是因子分析过程中的初始因子载荷矩阵中的元素, 是第j个公共因子,是第i个原观测变量的特殊因子。且此处的与的
均值都为0,方差都为1。
3 主成分的各系数,是唯一确定的、正交的。
不可以对系数矩阵进行任何的旋转,
且系数大小并不代表原变量与主成分的相关程度;
而因子模型的系数矩阵是不唯一的、可以进行旋转的,
且该矩阵表明了原变量和公共因子的相关程度。
4 主成分分析,可以通过可观测的原变量X直接求得主成分Y,
并具有可逆性;因子分析中的载荷矩阵是不可逆的,
只能通过可观测的原变量去估计不可观测的公共因 子,
即公共因子得分的估计值等于因子得分系数矩阵与原观测变量标准化
后的矩阵相乘的结果。还有,
主成分分析不可以像因子分析那样进行因子旋转处理。
5综合排名。主成分分析一般依据第一主成分的得分排名,
若第一主成分不能完全代替原始变量,
则需要继续选择第二个主成分、第三个等等,此时综合得 分=∑(各主成分得分×各主成分所对应的方差贡献率),
主成分得分是将原始变量的标准化值,
代入主成分表达式中计算得到;而因子分析的综合得分=∑(各因 子得分×各因子所对应的方差贡献率)÷∑各因子的方差贡献率,
因子得分是将原始变量的标准化值,代入因子得分函数中计算得到。
区别中存联系,联系中显区别
由于上文提到主成分可表示为原观测变量的线性组合,
其系数为原始变量相关矩阵的特征值所对应的特征向量,
且这些特征向量正交,因此,从X到Y的转换关系是可逆的,
便得到如下的关系:
(3)
下面对其只保留前m个主成分(贡献大),
舍弃剩下贡献很小的主成分,得:
i=1,2,p (4)
由此可见,式(4)在形式上已经与因子模型(2)
忽略特殊因子后的模型即:
(2)
相一致,且(j=1,2,…,m)之间相互独立。由于模型(2)
是因子分析中未进行因子载荷旋转时建立的模型,
故如果不进行因子载荷旋转,
许多应用者将容易把此时的因子分析理解成主成分分析,
这显然是不正确的。
然而此时的主成分的系数阵即特征向量与因子载荷矩阵确实存在如下
关系:
主成分分析中,主成分的方差等于原始数据相关矩阵的特征根,
其标准差也即特征根的平方根,于是可以将除以其标准差(单位化)
后转化成合适的公因子,即令,,则式(4)变为:
(4)
可得, (5)
老大,首先,你上传的图我无法看清。
其次,用SPSS软件做主成分分析也没那么复杂,不过你要钻研一番。下面的说明及举例希望可以对你有帮助:
主成分分析法在SPSS中的操作
1、指标数据选取、收集与录入(表1)
2、Analyze →Data Reduction →Factor Analysis,弹出Factor Analysis 对话框:
3、把指标数据选入Variables 框,Descriptives: Correlation Matrix 框组中选中Coefficients,然后点击Continue, 返回Factor Analysis 对话框,单击OK。
注意:SPSS 在调用Factor Analyze 过程进行分析时, SPSS 会自动对原始数据进行标准化处理, 所以在得到计算结果后的变量都是指经过标准化处理后的变量, 但SPSS 并不直接给出标准化后的数据, 如需要得到标准化数据, 则需调用Descriptives 过程进行计算。
从表3 可知GDP 与工业增加值, 第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系, 与海关出口总额存在着显著关系。可见许多变量之间直接的相关性比较强, 证明他们存在信息上的重叠。
主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。特征值在某种程度上可以被看成是表示主成分影响力度大小的指标, 如果特征值小于1, 说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大, 因此一般可以用特征值大于1作为纳入标准。通过表4( 方差分解主成分提取分析) 可知, 提取2个主成分, 即m=2, 从表5( 初始因子载荷矩阵) 可知GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷, 说明第一主成分基本反映了这些指标的信息; 人均GDP 和农业增加值指标在第二主成分上有较高载荷, 说明第二主成分基本反映了人均GDP 和农业增加值两个指标的信息。所以提取两个主成分是可以基本反映全部指标的信息, 所以决定用两个新变量来代替原来的十个变量。但这两个新变量的表达还不能从输出窗口中直接得到, 因为“Component Matrix”是指初始因子载荷矩阵, 每一个载荷量表示主成分与对应变量的相关系数。
用表5( 主成分载荷矩阵) 中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数。将初始因子载荷矩阵中的两列数据输入( 可用复制粘贴的方法) 到数据编辑窗口( 为变量B1、B2) , 然后利用“Transform→Compute Variable”, 在Compute Variable对话框中输入“A1=B1/SQR(722)”[注: 第二主成分SQR后的括号中填1235, 即可得到特征向量A1(见表6)。同理, 可得到特征向量A2。将得到的特征向量与标准化后的数据相乘, 然后就可以得出主成分表达式[注: 因本例只是为了说明如何在SPSS 进行主成分分析, 故在此不对提取的主成分进行命名, 有兴趣的读者可自行命名。
标准化:通过Analyze→Descriptive Statistics→Descriptives 对话框来实现: 弹出Descriptives 对话框后, 把X1~X10 选入Variables 框, 在Save standardized values as variables 前的方框打上钩, 点击“OK”, 经标准化的数据会自动填入数据窗口中, 并以Z开头命名。
以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重计算主成分综合模型, 即用第一主成分F1 中每个指标所对应的系数乘上第一主成分F1 所对应的贡献率再除以所提取两个主成分的两个贡献率之和, 然后加上第二主成分F2 中每个指标所对应的系数乘上第二主成分F2 所对应的贡献率再除以所提取两个主成分的两个贡献率之和, 即可得到综合得分模型:
根据主成分综合模型即可计算综合主成分值, 并对其按综合主成分值进行排序, 即可对各地区进行综合评价比较, 结果见表8。
具体检验还需进一步探讨与学习
欢迎分享,转载请注明来源:品搜搜测评网