因子分析
1输入数据。
2点Analyze 下拉菜单,选Data Reduction 下的Factor 。
3打开Factor Analysis后,将数据变量逐个选中进入Variables 对话框中。
4单击主对话框中的Descriptive按扭,打开Factor Analysis: Descriptives子对话框,在Statistics栏中选择Univariate Descriptives项要求输出个变量的均值与标准差,在Correlation Matrix 栏内选择Coefficients项,要求计算相关系数矩阵,单击Continue按钮返回Factor Analysis主对话框。
5单击主对话框中的Extraction 按钮,打开如下图所示的Factor Analysis: Extraction 子对话框。在Method列表中选择默认因子抽取方法——Principal Components,在Analyze 栏中选择默认的Correlation Matrix 项要求从相关系数矩阵出发求解主成分,在Exact 栏中选择Number of Factors;6, 要求显示所有主成分的得分和所能解释的方差。单击Continue按钮返回Factor Analysis主对话框。
6单击主对话框中的OK 按钮,输出结果。
多元线性回归
1打开数据,依次点击:analyse--regression,打开多元线性回归对话框。
2将因变量和自变量放入格子的列表里,上面的是因变量,下面的是自变量。
3设置回归方法,这里选择最简单的方法:enter,它指的是将所有的变量一次纳入到方程。其他方法都是逐步进入的方法。
4等级资料,连续资料不需要设置虚拟变量。多分类变量需要设置虚拟变量。
虚拟变量ABCD四类,以a为参考,那么解释就是b相对于a有无影响,c相对于a有无影响,d相对于a有无影响。
5选项里面至少选择95%CI。
点击ok。
统计专业研究生工作室原创,请勿复杂粘贴
1输入数据。
2点Analyze 下拉菜单,选Data Reduction 下的Factor 。
3打开Factor Analysis后,将数据变量逐个选中进入Variables 对话框中。
4单击主对话框中的Descriptive按扭,打开Factor Analysis: Descriptives子对话框,在Statistics栏中选择Univariate Descriptives项要求输出个变量的均值与标准差,在Correlation Matrix 栏内选择Coefficients项,要求计算相关系数矩阵,单击Continue按钮返回Factor Analysis主对话框。
5单击主对话框中的Extraction 按钮,打开如下图所示的Factor Analysis: Extraction 子对话框。在Method列表中选择默认因子抽取方法——Principal Components,在Analyze 栏中选择默认的Correlation Matrix 项要求从相关系数矩阵出发求解主成分,在Exact 栏中选择Number of Factors;6, 要求显示所有主成分的得分和所能解释的方差。单击Continue按钮返回Factor Analysis主对话框。
6单击主对话框中的OK 按钮,输出结果。
工具/原料
spss200
方法/步骤
先在spss中准备好要处理的数据,然后在菜单栏上执行:analyse--dimension reduction--factor analyse。打开因素分析对话框
我们看到下图就是因素分析的对话框,将要分析的变量都放入variables窗口中
点击descriptives按钮,进入次级对话框,这个对话框可以输出我们想要看到的描述统计量
因为做主成分分析需要我们看一下各个变量之间的相关,对变量间的关系有一个了解,所以需要输出相关,勾选coefficience,点击continue,返回主对话框
回到主对话框,点击ok,开始输出数据处理结果
你看到的这第一个表格就是相关矩阵,现实的是各个变量之间的相关系数,通过相关系数,你可以看到各个变量之间的相关,进而了解各个变量之间的关系
第二个表格显示的主成分分析的过程,我们看到eigenvalues下面的total栏,他的意思就是特征根,他的意义是主成分影响力度的指标,一般以1为标准,如果特征根小于1,说明这个主因素的影响力度还不如一个基本的变量。所以我们只提取特征根大于1的主成分。如图所示,前三个主成分就是大于1的,所以我们只能说有三个主成分。另外,我们看到第一个主成分方差占所有主成分方差的469%,第二个占275%,第三个占150%。这三个累计达到了895%。
一、研究场景
主成分分析用于对数据信息进行浓缩,比如总共有20个指标值,是否可以将此20项浓缩成4个概括性指标。除此之外,主成分分析可用于权重计算和综合竞争力研究。即主成分分共有三个实际应用场景:
二、SPSSAU操作
SPSSAU左侧仪表盘“进阶方法”→“主成分”;
三、SPSSAU一般步骤
第一步:判断是否进行主成分(pca)分析;判断标准为KMO值大于06。
第二步:主成分与分析项对应关系判断。
特别提示: 如果研究目的完全在于信息浓缩,并且找出主成分与分析项对应关系,此时SPSSAU建议使用因子分析请参考因子分析手册,而非主成分分析。主成分分析目的在于信息浓缩(但不太关注主成分与分析项对应关系),权重计算,以及综合得分计算。
有时不太会关注主成分与分析项的对应关系情况,比如进行综合竞争力计算时,不需要过多关注主成分与分析项的对应关系情况。
主成与分析项对应关系判断: 假设预期为3个主成分,分析项为10个;主成分与分析项交叉共得到30个数字,此数字称作“载荷系数”(载荷系数值表示分析项与主成分之间的相关程度); 针对每个主成分,对应10个”载荷系数”,针对每个分析项,则有3个“载荷系数值”(比如0765,-0066,0093),选出3个数字绝对值大于04的那个值(0765),如果其对应主成分1,则说明此分析项应该划分在主成分1下面
对不合理分析项进行删除 ,共有三种情况; 第一类:如果分析项的共同度(公因子方差)值小于04,则对应分析项应该作删除处理;第二类:某分析项对应的“载荷系数”的绝对值,全部均小于04,也需要删除此分析项;第三类:如果某分析项与主成分对应关系出现严重偏差(通常也称作‘张冠李戴’),也需要对该分析项进行删除处理
第三步:主成分命名
在第二步删除掉不合理分析项后,并且确认主成分与分析项对应关系良好后,则可结合主成分与分析项对应关系,对主成分进行命名
四、主成分分析计算权重
1方差解释率表格
使用主成分分析得到方差解释率表格,主成分分析一共提取出2个主成分,特征根值均大于1,此2个主成分的方差解释率分别是54450%,7798%,累积方差解释率为62248%。
2载荷系数表格
载荷系数表格里显示的是各分析项在主成分中的载荷系数,载荷系数可以反映主成分对于分析项的信息提取情况。
在计算分析项权重的时候,需要利用载荷系数等信息进行计算,共分为三步:
第一:计算线性组合系数矩阵,公式为:loading矩阵/Sqrt(特征根),即载荷系数除以对应特征根的平方根。
3线性组合系数及权重结果
在计算分析项权重的时候,需要利用载荷系数等信息进行计算,共分为三步:
第一: 计算线性组合系数矩阵,公式为:loading矩阵/Sqrt(特征根),即 载荷系数除以对应特征根的平方根。
例:主成分1:
以此类推。
主成分2:
以此类推。
第二: 计算综合得分系数,公式为: 累积(线性组合系数方差解释率)/累积方差解释率 ,即线性组合系数分别与方差解释率相乘后累加,并且除以累积方差解释率,即得到综合得分系数。
例:(02875445%)/6225% + (01201780%)/6225%≈02661;
(02785445%)/6225% + (01201780%)/6225%≈02683;
(024435445%)/6225% + (05818 780%)/6225%≈02866;
(026175445%)/6225% + (04385 780%)/6225%≈02839;
以此类推。
第三: 计算权重,将综合得分系数进行求和归一化处理即得到各指标权重值。
求和归一化:
例:综合得分系数和为32671,(02661+02683+…+02199=32671)。
02661/32671=815%;02683/32671=821%;02866/32671=877%;以此类推。
4载荷图
载荷图 是针对成分与旋转后载荷值关系的图形化展示,使用较少,通常需要手工加‘圆圈’把挨在一起的因子圈起来,更直观展示成分与分析项的隶属对应关系情况。由于可读性和解释性问题,一般只关注于方差解释率靠前的前面几个成分,多数情况下只关注2个。
五、其他输出指标说明
1KMO 和 Bartlett 的检验
使用主成分分析进行信息浓缩研究,首先分析研究数据是否适合进行主成分分析,从上表可以看出:KMO为0910,大于06,满足主成分分析的前提要求,意味着数据可用于主成分分析研究。以及数据通过Bartlett 球形度检验(p<005),说明研究数据适合进行主成分分析。
2成份得分系数矩阵
使用主成分分析目的在于信息浓缩,则忽略“成份得分系数矩阵”表格。如果使用主成分分析法进行权重计算,则需要使用“成份得分系数矩阵”建立主成分和研究项之间的关系等式(基于标准化后数据建立关系表达式),如下:
成分得分1
=0104A1+0101A2+…+0101D2+0090D3;
成分得分2
=0115A1+0192A2+…-0044D2+0025D3;
3碎石图
可结合 碎石图 辅助判断主成分提取个数。当折线由陡峭突然变得平稳时,陡峭到平稳对应的主成分个数即为参考提取主成分个数。实际研究中更多以专业知识,结合主成分与研究项对应关系情况,综合权衡判断得出主成分个数。图中可以看出当横坐标为2时,折线突然变得比较平稳。
六、疑难解惑
1主成分回归是什么意思?
主成分分析后,选中保存‘成分得分’,SPSSAU系统会新生成标题用于标识‘成分得分’,比如:PcaScore1_1234,继续使用‘成分得分’用于接下来的线性回归分析,即称作‘主成分回归’,通常‘主成分回归’用于解决共线性问题。
2SPSSAU时,面板数据如何进行主成分分析?
面板数据可直接进行主成分分析,面板数据格式相对较为特殊,在分析上直接针对研究指标进行分析即可。
3 SPSSAU时,成分得分是标准化后的数据进行吗?
成分得分的数据计算,默认是基于标准化后的数据进行。
七、总结
在各个领域的科学研究中,为了全面客观的分析问题,往往需要对反映事物的多个变量进行大量的观测,如果对这些变量进行一个一个的分析,可能会造成看待事物片面,不好得出一致的结论,主成分分析就是考虑各指标之间的相互关系,利用降维的思维,把多个指标转换成较少的几个互不相关的综合指标,从而使研究变的更简单。以上就是主成分分析的指标说明。
更多干货请前往 SPSSAU 官网查看。
主成分分析不是一个独立的统计阶段,而是一个初步结果,其应用有两个方面:
一是主成分评价,另一个是主成分回归。这里,我只给您介绍主成分评价。
主成分评价的步骤:
第一步,对原始数据进行无量纲化处理,公式是减均值比上标准差。
如果用统计软件SPSS操作,则点击菜单“分析---描述统计---描述”,把全部变量选进变量框,勾选“将标准化得分另存为变量”,然后点确定,
第二步, 计算特征根、方差贡献率、累计方差贡献率以及主成分载荷矩阵
在SPSS点击菜单“分析--降维--因子分析”,把标准化后的所有变量调入变量框,确定。得表1和表2。表1给出了两个主成分的特征根,分别是5624和1997(例)。
表1 方差分析表
表2(例) 主成分矩阵
第三步,提取主成分
由表1可知,提取了两个主成分,这两个主成分的累计方差贡献率高达95261%,表明提取前两个主成分可以基本反映全部8个指标所具有的信息。
第四步,计量特征向量
特征向量等于主成分矩阵(表2)除以特征值的平方根。表3即计算出的两个特征向量:
表3 特征向量表
第五步, 计算主成分得分
利用这两个公式可以求出两个主成分F1和F2的得分。
第六步,计算综合得分
表9从略。
主成分分析不需要旋转,因子分析才需要。
希望能帮上您!刘得意统计服务
1、主成分分析(PrincipalComponentAnalysis,PCA),是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
2、在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
3、主成分分析首先是由K皮尔森(KarlPearson)对非随机变量引入的,尔后H霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。
欢迎分享,转载请注明来源:品搜搜测评网