一、性质不同
1、主成分分析法性质:通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量。
2、因子分析法性质:研究从变量群中提取共性因子的统计技术。
二、应用不同
1、主成分分析法应用:比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。
2、因子分析法应用:
(1)消费者习惯和态度研究(U&A)
(2) 品牌形象和特性研究
(3)服务质量调查
(4) 个性测试
(5)形象调查
(6) 市场划分识别
(7)顾客、产品和行为分类
扩展资料:
主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时,根据实际需要,尽量少取几个求和变量,以反映原始变量的信息。
这种统计方法被称为主成分分析或主成分分析,这也是一种处理降维的数学方法。主成分分析(PCA)是试图用一组新的不相关的综合指标来代替原来的指标。
因子分析为社会研究的一种有力工具,但不能确定一项研究中有几个因子。当研究中选择的变量发生变化时,因素的数量也会发生变化。此外,对每个因素的实际含义的解释也不是绝对的。
-主成分分析
-因子分析
1 主成分分析基本原理
主成分分析法 ( Principal Component Analysis,PCA) 是多变量统计方法中的一种,该概念首先由 Karl Pearson 在1901 年提出,当时只限于非随机变量的讨论,1933 年 Hotelling将该概念推广到随机变量。主成分分析法通过将具有一定相关性的多个指标转化为少数几个综合性指标,在确保数据信息丢失最少的前提下对高维变量空间作降维处理,因此是综合处理上述多变量问题的一种强有力的工具。若需要解决的问题中指标数越多且各指标间相关程度越密切,则主成分分析法降维处理的优越性越能得到充分体现。
在多光谱遥感影像中,各个波段影像之间存在相关性,并包含了冗余信息,基于主成分分析的基本思想是,将一组线性相关的变量变为一组相互独立的、相互正交的变量,而新的变量是输入变量的线性组合。这样就能消除各个波段影像之间的信息冗余。这种方法,所得到的结果是能够改变 P 个波段影像变换到 Y ( Y < P) 个主分量的像素定义,能够简化多光谱影像的数据处理过程,但不损失原影像信息。有关主成分分析的详细基本原理参见第四章第三节 K - L 变换。
2 基于 TM 影像主成分分析实例
选取研究区内蒙古大青山地区色尔腾山一段 TM 影像的 710 ×470 子区进行试验研究( 周成虎,2003) 。该区出露的岩石主要为: 桑干群 ( Ar1Sg) 片麻岩夹大理岩组、五台群( Ar2Wt) 绿 泥 片 岩 和 绢 云 石 英 片 岩 夹 含 铁 石 英 岩; 侏 罗 系的 中、下 统 石 拐 群 ( J1 - 2Sh1 - 2,3) 砂页岩组和砾岩组; 燕山早期肉红色中细粒钾长花岗岩 ( γ25) ,加里东晚期灰绿色细粒黑云母花岗岩 ( γo33) ( 图 7-13) 。
TM 数据的轨道号为: PATH-128,ROW = 32,由于 TM 第 6 波段空间分辨率较低,因而未利用,只对其余六个波段进行了主成分分析和对应分析处理。
对所选影像进行主成分分析,特征向量矩阵见表 7-3。
分析表 7-3,可得出如下几点结论:
( 1) 在 PC1 主成分上,六个波段均为正值,其中第 5 波段贡献最大,其次是波段 7,4 和 3。总体说来,PC1 主成分反映的是影像六个波段的加信息,反映在 PC1 影像,主要表现的是亮度信息和地形信息。
( 2) PC2 主成分是波段 4,5,7 的和减去波段 1,2,3 的和的线性变换,其中第 1 波段与 PC2 呈明显的负相关。
( 3) PC3 主成分是波段 1,5,7 的和减去波段 2,3,4 的和的线性组合,其中除波段1 之外,其余波段对 PC2 主成分的贡献基本相同。
( 4) PC4 主成分主要反映的是波段 5 的减信息和波段 7 的加信息。
( 5) 波段 2 和波段 4 对 PC5 主成分的贡献最大,其中波段 2 为加信息,波段 4 为减信息,PC5 是它们的体现。
图 7-13 色尔腾山矿产地质示意图( 据内蒙古地区矿产局 1∶20 万佘太镇矿产图)
表 7-3 主成分分析的特征向量矩阵
( 6) PC6 是波段 2 和波段 4 的加信息与波段 3 的减信息的线性组合。
图 7-14 是上述六个特征向量 ( 主成分) 反变换后的影像。
从图 7-14 的六个主成分影像看,主成分 5,4,3 ( PC5,PC4,PC3) 较好地反映了该区的岩性信息。另外,各种岩石在这三个主成分影像上的反差也大,故选取 PC5,PC4,PC3 作假彩色 RGB 合成,结果很好地进行了该区岩性的提取和区分。将结果与地质示意图相对照,基本吻合。与原始影像 1,4,7 波段的假彩色合成影像相比,岩性信息更加突出 ( 图版 11) 。
图 7-14 研究区 TM 影像的六个主成分影像( 据周成虎等,2003)
一、性质不同
1、主成分分析法性质:通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量。
2、因子分析法性质:研究从变量群中提取共性因子的统计技术。
二、应用不同
1、主成分分析法应用:比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。
2、因子分析法应用:
(1)消费者习惯和态度研究(U&A)
(2) 品牌形象和特性研究
(3)服务质量调查
(4) 个性测试
(5)形象调查
(6) 市场划分识别
(7)顾客、产品和行为分类
扩展资料:
主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时,根据实际需要,尽量少取几个求和变量,以反映原始变量的信息。
这种统计方法被称为主成分分析或主成分分析,这也是一种处理降维的数学方法。主成分分析(PCA)是试图用一组新的不相关的综合指标来代替原来的指标。
因子分析为社会研究的一种有力工具,但不能确定一项研究中有几个因子。当研究中选择的变量发生变化时,因素的数量也会发生变化。此外,对每个因素的实际含义的解释也不是绝对的。
-主成分分析
-因子分析
利用加权主成分分析法描述两个或多个。
主成分分析法原理如下:
主成分分析,是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
主成分分析首先是由K·皮尔森(Karl Pearson)对非随机变量引入的,尔后H·霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。
在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。
在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。
主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。
重点骨干矿山是指在众多矿山中具有支柱地位和在国民经济中占有重要地位的矿山。因此,在筛选重点骨干矿山时,以矿山规模、年产矿量和年销售收入三个指标作为衡量依据。
一、主成分分析原理
在社会经济的研究中,为了全面系统地分析和研究问题,必须考虑许多经济指标,这些指标能从不同的侧面反映我们所研究对象的特征,但指标在某种程度上存在信息的重叠,具有一定的相关性。主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。即研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变量各方面的信息。这些综合指标就称为主成分。主成分分析的主要步骤如下:假设有p个指标,即p个随机变量,记为X1,X2,…,Xp,主成分分析就是要把这p个指标的问题转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2,…,Fk(k≤p)按照保留主要信息量的原则,充分反映原指标的信息,并且相互独立。
这种由讨论多个指标降为少数几个综合指标的过程,在数学上就叫做降维。主成分分析通常的做法是寻求原指标的线性组合Fi。其中,Xi是经过标准化后的变量。即
2009年度全国主要矿产品供需形势分析研究
新生成的F1,F2,…,Fp满足如下条件:
1)每个主成分的系数平方和为1。即
2009年度全国主要矿产品供需形势分析研究
2)主成分之间相互独立,即无重叠的信息。即
2009年度全国主要矿产品供需形势分析研究
3)主成分的方差依次递减,重要性依次递减,即
2009年度全国主要矿产品供需形势分析研究
4)多指标综合评价。通过主成分分析,选择m个主成分y1,y2,…,ym,以每个主成分yi的方差贡献率αi作为权重,构造综合评价函数:
2009年度全国主要矿产品供需形势分析研究
式中: 为第i个主成分的得分。
把m个主成分得分代入F函数后,即可得到每个样本的综合评价函数得分,以得分的大小排序。
二、重点骨干矿山的界定
以“全国矿产资源开发利用统计数据库”为基础,通过对其进行主成分分析和多指标综合评价来确定重点骨干矿山。
(一)铁矿山
1露天矿山
(1)相关性检验
Pearson相关系数反映了指标间的相关程度,相关系数越大,相关程度也就越高,在分析时重叠的信息也就越多,这将导致分析效果降低,因此必须首先进行相关性检验。检验结果显示,从业人数同自产矿石量正相关,相关系数达到0533,并在P<001的水平下显著正相关;从业人数同矿产品销售收入之间也存在显著正相关性,相关系数达到0586;同样,自产矿石量同矿产品销售收入显著正相关,相关系数达到0743。露天骨干矿山的检验结果见表7。
表7 相关系数矩阵
(2)主成分分析
由于三个指标间存在着显著的相关性,因此采用主成分分析方法进行降维处理。结果显示,提取一个主成分将解释原指标向量7484%的信息,提取两个主成分将提高到9157%,因此我们提取两个主成分,两个主成分对各指标的解释程度分别达到997%、890%和860%(表9~表11)。表达式分别为
2009年度全国主要矿产品供需形势分析研究
式中:Z从业人员、Z自产矿石量、Z矿产品销售收入分别表示标准化后的从业人员、自产矿石量和矿产品销售收入;λ1、λ2分别表示第一个和第二个特征根。
表8 总方差解释程度
注:采用主成分分析法提取因子。
表9 单指标方差解释程度
注:采用主成分分析法提取因子。
表10 初始因子载荷矩阵a
注:采用主成分分析法提取因子。确定提取2个因子。
(3)综合评价提取出主成分后利用公式(10)计算综合得分: 为第i个主成分的得分,αi为第i个主成分的方差贡献率。此处,α1为07484,α2为01673。经过筛选将综合得分>0的14座矿山即兰尖矿和朱家包包矿、齐大山铁矿、白云鄂博铁矿、海南矿业、南芬铁矿、尖山铁矿、凹山铁矿、歪头山铁矿、大孤山铁矿、峨口铁矿、弓长岭铁矿、大顶铁矿、大宝山矿业和水厂铁矿列为重点骨干矿山(表11)。
表11 重点骨干铁矿山筛选结果
续表
注:F1———第一主成分;F2———第二主成分;F———综合得分;全国矿产资源开发利用统计库中将兰尖矿和朱家包包矿的相关数据统计在一起,所以这里我们将其算作一个矿山。
2地下矿山
与露天矿山相似,提取一个主成分将解释原指标向量5452%的信息,提取两个主成分将提高到8571%,因此我们提取两个主成分,两个主成分对各指标的解释程度分别达到855%、942%和775%。表达式分别为
2009年度全国主要矿产品供需形势分析研究
式中:Z从业人员、Z自产矿石量、Z矿产品销售收入分别表示标准化后的从业人员、自产矿石量和矿产品销售收入。
提取出主成分后利用公式(10)计算综合得分: 为第i个主成分的得分,αi为第i个主成分的方差贡献率。此处,α1为05452,α2为03119。经过筛选,将综合得分>0的7座矿山即梅山铁矿、程潮铁矿、北洺河铁矿、鲁中冶金矿业、西石门铁矿、大红山铁矿和金岭铁矿列为重点骨干矿山(表11)。
(二)铜矿山
与确定铁矿重点骨干矿山原理类似,提取出主成分后利用公式(10)计算综合得分: 为第i个主成分的得分,αi为第i个主成分的方差贡献率。此处,α1为088489,α2为008944。经过筛选,得出全国重点骨干铜矿山共有10个(表12)。
表12 重点骨干铜矿山筛选结果
注:F1———第一主成分;F2———第二主成分;F———综合得分。
一、性质不同
1、主成分分析法性质:通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量。
2、因子分析法性质:研究从变量群中提取共性因子的统计技术。
二、应用不同
1、主成分分析法应用:比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。
2、因子分析法应用:
(1)消费者习惯和态度研究(U&A)
(2) 品牌形象和特性研究
(3)服务质量调查
(4) 个性测试
(5)形象调查
(6) 市场划分识别
(7)顾客、产品和行为分类
扩展资料:
主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时,根据实际需要,尽量少取几个求和变量,以反映原始变量的信息。
这种统计方法被称为主成分分析或主成分分析,这也是一种处理降维的数学方法。主成分分析(PCA)是试图用一组新的不相关的综合指标来代替原来的指标。
因子分析为社会研究的一种有力工具,但不能确定一项研究中有几个因子。当研究中选择的变量发生变化时,因素的数量也会发生变化。此外,对每个因素的实际含义的解释也不是绝对的。
-主成分分析
-因子分析
欢迎分享,转载请注明来源:品搜搜测评网