一、 主成分分析
1导入数据后,先将数据标准化,消除单位的影响。
图1-1
标准化后的数据见图1-2
图1-2 标准化数据
2、做主成分分析
操作步骤见图2-1、图2-2
图2-1因子分析图2-2
3、提取结果,根据特征值大于1提取出了三个主成分。
图3-1特征值图3-2成分矩阵
根据成分矩阵可以写出主成分的表达式
4、根据主成分排序
图4-1 排名前10图4-2排名后10
结论:这三个主成分因该是反应城市的交通运输旅游住宿的水平,所以西部城市排名较后、东部城市靠前。
二、判别分析
目的:为了研究某地区育龄妇女的生育情况,根据生育峰值年龄、一胎生育率、二胎生育率、三胎生育率4项指标,收集到12个样品的分类情况,另收集到3个待判样品情况。 用贝叶斯判别法与费歇尔判别法建立判别规则,并对待判样品进行判断。
1、 组均值检验及协方差检验
(一)组均值同等检验
图11 组平均值的同等检验
由图11可知峰值年龄和二胎生育率平均值不显著,一胎生育率和三胎生育率平均值显著不同。
(二)协方差矩阵的博克斯等同性检验
图12 博克斯等同检验
显著性〈005显著性水平,说明组间协方差阵显著不相等。
2、进行判别
(一) 费歇判别
图 21 费歇标准化判别函数系数
由图21可以写出费歇判别函数y1=0918峰值年龄+1524一胎生育率+0232二胎生育率
(二)贝叶斯判别
图 22 贝叶斯判别式函数
由图22可知贝叶斯判别式函数可写成
从图23可以看出判别的结果,得知误判率等信息。
图 23贝叶斯判别结果
以上。
主成分
1输入数据。
2点Analyze 下拉菜单,选Data Reduction 下的Factor 。
3打开Factor Analysis后,将数据变量逐个选中进入Variables 对话框中。
4单击主对话框中的Descriptive按扭,打开Factor Analysis: Descriptives子对话框,在Statistics栏中选择Univariate Descriptives项要求输出个变量的均值与标准差,在Correlation Matrix 栏内选择Coefficients项,要求计算相关系数矩阵,单击Continue按钮返回Factor Analysis主对话框。
5单击主对话框中的Extraction 按钮,打开如下图所示的Factor Analysis: Extraction 子对话框。在Method列表中选择默认因子抽取方法——Principal Components,在Analyze 栏中选择默认的Correlation Matrix 项要求从相关系数矩阵出发求解主成分,在Exact 栏中选择Number of Factors;6, 要求显示所有主成分的得分和所能解释的方差。单击Continue按钮返回Factor Analysis主对话框。
6单击主对话框中的OK 按钮,输出结果。
多元线性回归
1打开数据,依次点击:analyse--regression,打开多元线性回归对话框。
2将因变量和自变量放入格子的列表里,上面的是因变量,下面的是自变量。
3设置回归方法,这里选择最简单的方法:enter,它指的是将所有的变量一次纳入到方程。其他方法都是逐步进入的方法。
4等级资料,连续资料不需要设置虚拟变量。多分类变量需要设置虚拟变量。
虚拟变量ABCD四类,以a为参考,那么解释就是b相对于a有无影响,c相对于a有无影响,d相对于a有无影响。
5选项里面至少选择95%CI。
点击ok。
统计专业研究生工作室原创,请勿复杂粘贴
首先、在spss中准备好要处理的数据,然后在菜单栏上执行:analyse--dimension reduction--factor analyse。打开因素分析对话框
接着、看到下图就是因素分析的对话框,将要分析的变量都放入variables窗口中
点击descriptives按钮,进入次级对话框,这个对话框可以输出我们想要看到的描述统计量
因为做主成分分析需要我们看一下各个变量之间的相关,对变量间的关系有一个了解,所以需要输出相关,勾选coefficience,点击continue,返回主对话框
回到主对话框,点击ok,开始输出数据处理结果
你看到的这第一个表格就是相关矩阵,现实的是各个变量之间的相关系数,通过相关系数,你可以看到各个变量之间的相关,进而了解各个变量之间的关系
第二个表格显示的主成分分析的过程,我们看到eigenvalues下面的total栏,他的意思就是特征根,他的意义是主成分影响力度的指标,一般以1为标准,如果特征根小于1,说明这个主因素的影响力度还不如一个基本的变量。所以我们只提取特征根大于1的主成分。如图所示,前三个主成分就是大于1的,所以我们只能说有三个主成分。另外,我们看到第一个主成分方差占所有主成分方差的469%,第二个占275%,第三个占150%。这三个累计达到了895%。
主成分分析不是一个独立的统计阶段,而是一个初步结果,其应用有两个方面:
一是主成分评价,另一个是主成分回归。这里,我只给您介绍主成分评价。
主成分评价的步骤:
第一步,对原始数据进行无量纲化处理,公式是减均值比上标准差。
如果用统计软件SPSS操作,则点击菜单“分析---描述统计---描述”,把全部变量选进变量框,勾选“将标准化得分另存为变量”,然后点确定,
第二步, 计算特征根、方差贡献率、累计方差贡献率以及主成分载荷矩阵
在SPSS点击菜单“分析--降维--因子分析”,把标准化后的所有变量调入变量框,确定。得表1和表2。表1给出了两个主成分的特征根,分别是5624和1997(例)。
表1 方差分析表
表2(例) 主成分矩阵
第三步,提取主成分
由表1可知,提取了两个主成分,这两个主成分的累计方差贡献率高达95261%,表明提取前两个主成分可以基本反映全部8个指标所具有的信息。
第四步,计量特征向量
特征向量等于主成分矩阵(表2)除以特征值的平方根。表3即计算出的两个特征向量:
表3 特征向量表
第五步, 计算主成分得分
利用这两个公式可以求出两个主成分F1和F2的得分。
第六步,计算综合得分
表9从略。
主成分分析不需要旋转,因子分析才需要。
希望能帮上您!刘得意统计服务
1、首先计算协方差矩阵Σ=(sij)p×p。
2、其次求出Σ的特征值λi及相应的正交化单位特征向量。
3、最后即可求出协差阵。协方差矩阵是一个矩阵,其每个元素是各个向量元素之间的协方差。
欢迎分享,转载请注明来源:品搜搜测评网