一、 主成分分析
1导入数据后,先将数据标准化,消除单位的影响。
图1-1
标准化后的数据见图1-2
图1-2 标准化数据
2、做主成分分析
操作步骤见图2-1、图2-2
图2-1因子分析图2-2
3、提取结果,根据特征值大于1提取出了三个主成分。
图3-1特征值图3-2成分矩阵
根据成分矩阵可以写出主成分的表达式
4、根据主成分排序
图4-1 排名前10图4-2排名后10
结论:这三个主成分因该是反应城市的交通运输旅游住宿的水平,所以西部城市排名较后、东部城市靠前。
二、判别分析
目的:为了研究某地区育龄妇女的生育情况,根据生育峰值年龄、一胎生育率、二胎生育率、三胎生育率4项指标,收集到12个样品的分类情况,另收集到3个待判样品情况。 用贝叶斯判别法与费歇尔判别法建立判别规则,并对待判样品进行判断。
1、 组均值检验及协方差检验
(一)组均值同等检验
图11 组平均值的同等检验
由图11可知峰值年龄和二胎生育率平均值不显著,一胎生育率和三胎生育率平均值显著不同。
(二)协方差矩阵的博克斯等同性检验
图12 博克斯等同检验
显著性〈005显著性水平,说明组间协方差阵显著不相等。
2、进行判别
(一) 费歇判别
图 21 费歇标准化判别函数系数
由图21可以写出费歇判别函数y1=0918峰值年龄+1524一胎生育率+0232二胎生育率
(二)贝叶斯判别
图 22 贝叶斯判别式函数
由图22可知贝叶斯判别式函数可写成
从图23可以看出判别的结果,得知误判率等信息。
图 23贝叶斯判别结果
以上。
新建一个txt文档,后缀改为SPS,用双击spss打开,把下面的语法文件拷贝进去,把变量/VARIABLES后面的b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11……改为你需要分析主成分的变量,然后全部选中。右击,选择Run Current就可以出结果了/为注解,不会影响语法运行。结果在Total Variance Explained表格中我用的是spss115不同版本语法都差不多的
语法:
/ 主成分分析语法,右击,选择Run Current就有结果了
FACTOR
/VARIABLES b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 b13 b14 b15 b16 b17 b18 b19 b20 b21 b22 b23 b24 b25 b26 b27 b28 b29 b30 /MISSING LISTWISE /ANALYSIS
b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 b13 b14 b15 b16 b17 b18 b19 b20 b21
b22 b23 b24 b25 b26 b27 b28 b29 b30
/PRINT INITIAL KMO EXTRACTION ROTATION FSCORE
/FORMAT SORT BLANK(10)
/PLOT EIGEN ROTATION
/CRITERIA MINEIGEN(1) ITERATE(25)
/EXTRACTION PC
/CRITERIA ITERATE(25)
/ROTATION VARIMAX
/METHOD=CORRELATION
一般都是需要通过每个主成分乘以各自权重值得到综合得分的,而不是直接把几个主成分相加,因为这样就默认几个主成分的权重都是一样的了我们通常以各个主成分的方差贡献率作为各自的权重值,也可以通过其他方法计算得到权重值
以下是我个人的看法,首先,我觉得楼主的主成分分析,没有一个清醒的认识,导致分析结果的图形是不是最终判决。在多元统计分析,主成分分析是依靠因子分析的结果。
请有怜悯的下一次攻击,但实际上,房东因子载荷矩阵?旋转前的因子载荷矩阵。在因子分析中,旋转因子是非常关键的一步措施,目的是为了使唯一的大的负载,对每个变量的一个共同的因素。被分成两个主要成分的指标,即白。
房东做了分析五个主要部分组成,11个变量指标,分析的最终结果,是关键因素,发挥关键作用的主要成分。楼上的答案是错误的,也是一个关键的因素
永不轮换显然是很容易找到想要的指标分为两类,一类是积极的价值为负数。然而,高负荷意味着更大的价值(不是绝对的),房东可以分析,给予积极的载荷矩阵从0-07几年,这样的一类指标归结为发挥了关键作用的主要成分是不合理的。这个原因,也有负01 - 07归因于小的指标的主成分载荷过任意的。在正常旋转后的因子载荷在08以上的因子载荷矩阵,这是最终的结果。
的房东希望有一个正确的结果,绕过去旋转后的因子载荷矩阵组成的第一因素,我很乐意帮助。
顺便因素的旋转操作事实上,所有的在一起在根据因子Analynis对话框中,单击“旋转”选项,选择因子旋转,一般都是最大方差法,选择方差最大显示列,选择“旋转”解决方案“复选框,单击”继续返回到主界面。 OK
1输入数据。
2点Analyze 下拉菜单,选Data Reduction 下的Factor 。
3打开Factor Analysis后,将数据变量逐个选中进入Variables 对话框中。
4单击主对话框中的Descriptive按扭,打开Factor Analysis: Descriptives子对话框,在Statistics栏中选择Univariate Descriptives项要求输出个变量的均值与标准差,在Correlation Matrix 栏内选择Coefficients项,要求计算相关系数矩阵,单击Continue按钮返回Factor Analysis主对话框。
5单击主对话框中的Extraction 按钮,打开如下图所示的Factor Analysis: Extraction 子对话框。在Method列表中选择默认因子抽取方法——Principal Components,在Analyze 栏中选择默认的Correlation Matrix 项要求从相关系数矩阵出发求解主成分,在Exact 栏中选择Number of Factors;6, 要求显示所有主成分的得分和所能解释的方差。单击Continue按钮返回Factor Analysis主对话框。
6单击主对话框中的OK 按钮,输出结果。
因子分析(你这里使用主成分法做因子分析)的好坏主要就是看看KMO,特征值方差贡献率,共同度和因子载荷,如果都比较好(一般就是说KMO值08以上,方差贡献率起码04,共同度起码也有04,因子载荷起码均在04以上),那就OK
KMO值书上(《吴明隆统计实务》)说的最低限度是05,方差贡献率40%是最低的可接受程度,你的67%已经挺高了,关键问题是KMO不好,KMO的意义在于检验你的这些数据有没有一定的内部相关,能不能形成一些局部因子,最少一个,因为因子分析就是给数据分类分维度,要是数据都零零散散,任何两个题目都不相似,就不适合因子分析,KMO就不高,想提高的话,酌情删除一些题目(主要是看因子载荷,太低的删,一个题目在两个因子上载荷接近的也删),再重新做因子分析看结果,如果还不好,就加题目,加一些你觉得比较好的项目,主要是靠删除不好的项目,不过要注意,每个维度最好至少留下3个题目
欢迎分享,转载请注明来源:品搜搜测评网