(1)首先将数据标准化,这是考虑到不同数据间的量纲不一致,因而必须要无量纲化。
(2)对标准化后的数据进行因子分析(主成分方法),使用方差最大化旋转。
(3)写出主因子得分和每个主因子的方程贡献率。 Fj =β1jX1 +β2jX2 +β3jX3 + ……+ βnjXn ; Fj 为主成分(j=1、2、……、m),X1、X2 、X3 、……、Xn 为各个指标,β1j、β2j、β3j、……、βnj为各指标在主成分Fj 中的系数得分,用ej表示Fj的方程贡献率。
(4)求出指标权重。 ωi=[(m∑j)βijej]/[(n∑i)(m∑j)βijej],ωi就是指标Xi的权重。
扩展资料
产品特点
1、操作简便
界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
2、编程方便
具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。
对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。
3、功能强大
具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。
-spss
老大,首先,你上传的图我无法看清。
其次,用SPSS软件做主成分分析也没那么复杂,不过你要钻研一番。下面的说明及举例希望可以对你有帮助:
主成分分析法在SPSS中的操作
1、指标数据选取、收集与录入(表1)
2、Analyze →Data Reduction →Factor Analysis,弹出Factor Analysis 对话框:
3、把指标数据选入Variables 框,Descriptives: Correlation Matrix 框组中选中Coefficients,然后点击Continue, 返回Factor Analysis 对话框,单击OK。
注意:SPSS 在调用Factor Analyze 过程进行分析时, SPSS 会自动对原始数据进行标准化处理, 所以在得到计算结果后的变量都是指经过标准化处理后的变量, 但SPSS 并不直接给出标准化后的数据, 如需要得到标准化数据, 则需调用Descriptives 过程进行计算。
从表3 可知GDP 与工业增加值, 第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系, 与海关出口总额存在着显著关系。可见许多变量之间直接的相关性比较强, 证明他们存在信息上的重叠。
主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。特征值在某种程度上可以被看成是表示主成分影响力度大小的指标, 如果特征值小于1, 说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大, 因此一般可以用特征值大于1作为纳入标准。通过表4( 方差分解主成分提取分析) 可知, 提取2个主成分, 即m=2, 从表5( 初始因子载荷矩阵) 可知GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷, 说明第一主成分基本反映了这些指标的信息; 人均GDP 和农业增加值指标在第二主成分上有较高载荷, 说明第二主成分基本反映了人均GDP 和农业增加值两个指标的信息。所以提取两个主成分是可以基本反映全部指标的信息, 所以决定用两个新变量来代替原来的十个变量。但这两个新变量的表达还不能从输出窗口中直接得到, 因为“Component Matrix”是指初始因子载荷矩阵, 每一个载荷量表示主成分与对应变量的相关系数。
用表5( 主成分载荷矩阵) 中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数。将初始因子载荷矩阵中的两列数据输入( 可用复制粘贴的方法) 到数据编辑窗口( 为变量B1、B2) , 然后利用“Transform→Compute Variable”, 在Compute Variable对话框中输入“A1=B1/SQR(722)”[注: 第二主成分SQR后的括号中填1235, 即可得到特征向量A1(见表6)。同理, 可得到特征向量A2。将得到的特征向量与标准化后的数据相乘, 然后就可以得出主成分表达式[注: 因本例只是为了说明如何在SPSS 进行主成分分析, 故在此不对提取的主成分进行命名, 有兴趣的读者可自行命名。
标准化:通过Analyze→Descriptive Statistics→Descriptives 对话框来实现: 弹出Descriptives 对话框后, 把X1~X10 选入Variables 框, 在Save standardized values as variables 前的方框打上钩, 点击“OK”, 经标准化的数据会自动填入数据窗口中, 并以Z开头命名。
以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重计算主成分综合模型, 即用第一主成分F1 中每个指标所对应的系数乘上第一主成分F1 所对应的贡献率再除以所提取两个主成分的两个贡献率之和, 然后加上第二主成分F2 中每个指标所对应的系数乘上第二主成分F2 所对应的贡献率再除以所提取两个主成分的两个贡献率之和, 即可得到综合得分模型:
根据主成分综合模型即可计算综合主成分值, 并对其按综合主成分值进行排序, 即可对各地区进行综合评价比较, 结果见表8。
具体检验还需进一步探讨与学习
如何用SPSS软件进行主成分分析郭显光摘要文章指出《统计分析软件SPSS/PC+》中主成分分析举例中的一处错误,比较了主成分分析和因子分析的异同,进而指出用SPSS软件不能直接进行主成分分析。作者根据主成分分析和因子分析的关系,提出一种先用SPSS的PC法得出因子载荷阵,然后求出特征向量,建立主成分模型的主成分分析计算方法。关键词主成分分析因子分析因子载荷阵特征向量一、关于主成分分析举例中的一处错误在SPSS的高级统计分析命令中,有因子分析的功能。例如,用FACTOR命令可以进行因子分析,用EXTRACTION子命令可以输出因子模型阵、变量被解释的因子方差、所提取的因子特征根和每个特征根代表的变量X总方差的百分比。在使用该命令时,可以指定提取因子的方法,包括PC(主成分法)、PAF(主轴因子法)等等,也可以指定因子旋转方式。在童忠勇教授主编的《统计分析软件SPSS/PC+》(陕西人民教育出版社,1990年)一书中,第213-215页给出了一个例子:某地区对下属12个县人口调查,其中5个经济变量为:X1(住户数)、X2(学校数)、X3(就业人数)、X4(年收(本文共计5页)
保存因子分析就好,如果用spssau分析前先勾选“因子得分”选项,即可在分析后得到因子得分项。
spss直接把几个因子都已经算出来了,就是duFAC1-1列就是因子F1,同理可以得知F2,F3不用算的,如果问F1怎么来的,就说是F1=0701X1-0549X2+0736X3+0216X4+0112X5-0318X6。
如果进行主成分分析之后又要进行回归分析,应该是用提取出来的主因子作为自变量进行计算的,回归是只能有一个自变量,一个因变量才算回归的,如果不是的话,建议你使用多项式属分析。
把因变量的值还有自变量的值放到EXCEL里,按列排列。然后全部圈起来,找图表选项,绘制散点图,之后对其中的点点击右键,进行数据拟合就可以得出式子。
扩展资料:
标准逐步回归法做两件事情。即增加和删除每个步骤所需的预测。
向前选择法从模型中最显著的预测开始,然后为每一步添加变量。
向后剔除法与模型的所有预测同时开始,然后在每一步消除最小显著性的变量。
这种建模技术的目的是使用最少的预测变量数来最大化预测能力。这也是处理高维数据集的方法之一。
-回归分析
1对于主成分分析,判断大小是根据绝对值大小来判断,而不是看它正负大小。
2主成分分析的目的就是降元,即找到主要的影响因子,排除影响较小的因子。分析因子负荷,看每个因子的负荷值,一般绝对值>07的因子,才能称为主要因子。对于你分析出的因子负荷值,可以看出,主成分1中,打工时间是主要影响因子,主成分2为寝る时间和移动时间,主成分3为外出时间,因此,将打工时间、寝る时间、移动时间和外出时间是主要影响因子,而重要程度依次降低。
补充:没分,就只能回答这些,有分可以更加详细。
KMO检验用于检查变量间的偏相关性 一般认为该值大于09时效果最佳 07以上尚可,06时效果较差
Bartlett's球形检验用于检验相关阵是否是单位阵 P<001说明指标间并非独立,取值是有关系的。可以进行因子分析
根据上图 可以看出一共提取了3个主成分 可是能解释的方差为69958%
软件默认的是提取特征根大于1的主成分 如果加上第四个主成分的话可以解释的变异度为8626%
所以结合专业知识 可以考虑是不是增加一个主成分。
扩展资料:
软件模块实际上就是将以前单独发行的SPSS AnswerTree软件整合进了SPSS平台。笔者几年前在自己的网站上介绍SPSS 11的新功能时,曾经很尖锐地指出SPSS的产品线过于分散,应当把各种功能较单一的小软件,如AnswerTree、Sample Power等整合到SPSS等几个平台上去。
看来SPSS公司也意识到了这一点,而AnswerTree就是在此背景下第一个被彻底整合的产品。
Classification Tree模块基于数据挖掘中发展起来的树结构模型对分类变量或连续变量进行预测,可以方便、快速的对样本进行细分,而不需要用户有太多的统计专业知识。在市场细分和数据挖掘中有较广泛的应用。
已知该模块提供了CHAID、Exhaustive CHAID和C&RT三种算法,在AnswerTree中提供的QUEST算法尚不能肯定是否会被纳入。
为了方便新老用户的使用,Tree模块在操作方式上不再使用AnswerTree中的向导方式,而是SPSS近两年开始采用的交互式选项卡对话框。但是,整个选项卡界面的内容实际上是和原先的向导基本一致的,另外,模型的结果输出仍然是AnswerTree中标准的树形图,这使得AnswerTree的老用户基本上不需要专门的学习就能够懂得如何使用该模块。
由于树结构模型的方法体系和传统的统计方法完全不同,贸然引入可能会引起读者统计方法体系的混乱。为此,本次编写的高级教程并未介绍该模块,而将在高级教程的下一个版本,以及关于市场细分问题的教材中对其加以详细介绍。
参考资料:
0你这个问卷设计得有问题,我用你的数据做了个问卷的项目分析:分别是题总相关、题项区分度。两项分析得出的结果都不是很理想。
1在题项总相关那里,只有域名规范、响应速度是显著的,即是跟你的问卷目的相关。
2而在体相区分度那里,只得出定制服务、域名规范、隐私说明、响应速度、语言版本这5项的数据。
首先说明了只有这5项数据符合spss的检验要求。因为从你你的统计数据也可以看出,1、2、5、6、10(对应信息检索、网站地图、域名规范、版权说明、ICP备案)五项都是相同的数据,说明没有区分度,不存在统计意义!!
而在制服务、域名规范、隐私说明、响应速度、语言版本这5项里,得出的区分度分析都不显著,均没有鉴别度,不能鉴别出不同问卷回答者的反应程度。
3结论:主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。以上的结果表明,是在是提不出至少两个相互无关的指标(主因子)来分组,因为你的题项没有区分度,相关性很强。
素以你的问卷设计有问题,需要从新设计题项或者答案!!所以不能进行主成份分析。
希望能帮到你!!
、 好辛苦啊,给分吧~~~~~!!我没金币了··T T
欢迎分享,转载请注明来源:品搜搜测评网