除了主成分分析法还有什么确定多变量权重的方法

除了主成分分析法还有什么确定多变量权重的方法,第1张

权重计算的确定方法在综合评价中重中之重,不同的方法对应的计算原理并不相同。在实际分析过程中,应结合数据特征及专业知识选择适合的权重计算。

第一类为AHP层次法和优序图法;此类方法利用数字的相对大小信息进行权重计算;此类方法为主观赋值法,通常需要由专家打分或通过问卷调研的方式,得到各指标重要性的打分情况,得分越高,指标权重越大。

此类方法适合于多种领域。比如想构建一个员工绩效评价体系,指标包括工作态度、学习能力、工作能力、团队协作。通过专家打分计算权重,得到每个指标的权重,并代入员工数据,即可得到每个员工的综合得分情况。

第二类为熵值法(熵权法);此类方法利用数据熵值信息即信息量大小进行权重计算。此类方法适用于数据之间有波动,同时会将数据波动作为一种信息的方法。

比如收集各地区的某年份的经济指标数据,包括产品销售率(X1)、资金利润率(X2)、成本费用利润率(X3)、劳动生产率(X4)、流动资金周转次数(X5),用熵值法计算出各指标权重,再对各地区经济效益进行比较。

第三类为CRITIC、独立性权重和信息量权重;此类方法主要是利用数据的波动性或者数据之间的相关关系情况进行权重计算。

比如研究利用某省医院2011年共计5个科室的数据指标(共计6个指标数据)进行CRITIC权重计算,最终可得到出院人数、入出院诊断符合率、治疗有效率、平均床位使用率、病床周转次数、出院者平均住院日这6个指标的权重。如果希望针对各个科室进行计算综合得分,那么可以直接将权重与自身的数据进行相乘累加即可,分值越高代表该科室评价越高。

第四类为因子分析和主成分法;此类方法利用了数据的信息浓缩原理,利用方差解释率进行权重计算。

比如对30个地区的经济发展情况的8项指标作主成分分析,主成分分析法可以将8个指标浓缩为几个综合指标(主成分),用这些指标(主成分)反映原来指标的信息,同时利用方差解释率得出各个主成分的权重。

地理环境是多要素的复杂系统,在我们进行地理系统分析时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上,这种想法是可以实现的,本节拟介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。

第一节 主成分分析方法的原理

主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的地理数据矩阵:

如何从这么多变量的数据中抓住地理事物的内在规律性呢?要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。

如果记原来的变量指标为x1,x2,…,xp,它们的综合指标——新变量指标为x1,x2,…,zm(m≤p)。则

在(2)式中,系数lij由下列原则来决定:

(1)zi与zj(i≠j;i,j=1,2,…,m)相互无关;

(2)z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差最大者;……;zm是与z1,z2,……zm-1都不相关的x1,x2,…,xp的所有线性组合中方差最大者。

这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一,第二,…,第m主成分。其中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。

从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是x1,x2,…,xp的相关矩阵的m个较大的特征值所对应的特征向量。

第二节 主成分分析的解法

主成分分析的计算步骤

通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:

(1)计算相关系数矩阵

在公式(3)中,rij(i,j=1,2,…,p)为原来变量xi与xj的相关系数,其计算公式为

因为R是实对称矩阵(即rij=rji),所以只需计算其上三角元素或下三角元素即可。

(2)计算特征值与特征向量

首先解特征方程|λI-R|=0求出特征值λi(i=1,2,…,p),并使其按大小顺序排列,即λ1≥λ2≥…,≥λp≥0;然后分别求出对应于特征值λi的特征向量ei(i=1,2,…,p)。

(3)计算主成分贡献率及累计贡献率

一般取累计贡献率达85-95%的特征值λ1,λ2,…,λm所对应的第一,第二,……,第m(m≤p)个主成分。

(4)计算主成分载荷

由此可以进一步计算主成分得分:

第三节 主成分分析应用实例

主成分分析实例

对于某区域地貌-水文系统,其57个流域盆地的九项地理要素:x1为流域盆地总高度(m)x2为流域盆地山口的海拔高度(m),x3为流域盆地周长(m),x4为河道总长度(km),x5为河

表2-14 某57个流域盆地地理要素数据

道总数,x6为平均分叉率,x7为河谷最大坡度(度),x8为河源数及x9为流域盆地面积(km)的原始数据如表2-14所示。张超先生(1984)曾用这些地理要素的原始数据对该区域地貌-水文系统作了主成分分析。下面,我们将其作为主成分分析方法在地理学研究中的一个应用实例介绍给读者,以供参考。

表2-15相关系数矩阵

(1)首先将表2-14中的原始数据作标准化处理,由公式(4)计算得相关系数矩阵(见表2-15)。

(2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表2-16)。由表2-16可知,第一,第二,第三主成分的累计贡献率已高达865%,故只需求出第一,第二,第三主成分z1,z2,z3即可。

表2-16 特征值及主成分贡献率

(3)对于特征值λ1=5043,λ2=1746,λ3=0997分别求出其特征向量e1,e2,e3,并计算各变量x1,x2,……,x9在各主成分上的载荷得到主成分载荷矩阵(见表2-17)。

表2-17 主成分载荷矩阵

从表2-17可以看出,第一主成分z1与x1,x3,x4,x5,x8,x9有较大的正相关,这是由于这六个地理要素与流域盆地的规模有关,因此第一主成分可以被认为是流域盆地规模的代表:第二主成分z2与x2有较大的正相关,与x7有较大的负相关,而这两个地理要素是与流域切割程度有关的,因此第二主成分可以被认为是流域侵蚀状况的代表;第三主成分z3与x6有较大的正相关,而地理要素x6是流域比较独立的特性——河系形态的表征,因此,第三主成成可以被认为是代表河系形态的主成分。

以上分析结果表明,根据主成分载荷,该区域地貌-水文系统的九项地理要素可以被归为三类,即流域盆地的规模,流域侵蚀状况和流域河系形态。如果选取其中相关系数绝对值最大者作为代表,则流域面积,流域盆地出口的海拔高度和分叉率可作为这三类地理要素的代表,利用这三个要素代替原来九个要素进行区域地貌-水文系统分析,可以使问题大大地简化。

二、内梅罗水质指数污染

表1 内梅罗水质指数污染等级划分标准 P <1 1~2 2~3 3~5 >5 水质等级 清洁 轻污染 污染 重污染 严重污染 表2 地表水环境质量标准(GB3838—2002) 单位:mg/L 序 号 项 目 V类标准值 1 水温(℃) — 2 PH值(无量纲) 6—9 3 溶解氧 ≥ 2 4 高锰酸盐指数 ≤ 15 5 化学需氧量 ≤ 40 6 五日生化需氧量 ≤ 10 7 氨氮 ≤ 20 8 总磷 ≤ 04 9 总氮 ≤ 20 10 铜 ≤ 10 11 锌 ≤ 20 12 氟化物 ≤ 15 13 硒 ≤ 002 14 砷 ≤ 01 15 汞 ≤ 0001 16 镉 ≤ 001 17 铬(六价) ≤ 01 18 铅 ≤ 01 19 氰化物 ≤ 02 20 挥发酚 ≤ 01 21 石油类 ≤ 10 22 硫化物 ≤ 10 23 粪大肠菌群(个/L) ≤ 40000 表3 水质评价计算方法 单因子污染指数 Pi = Ci/ Si Ci——第i项污染物的监测值; Si——第i项污染物评价标准值; 溶解氧指数Cf——对应温度T时的饱和溶解氧浓度;

Ci——溶解氧浓度监测值;

Si——溶解氧评价标准值;                pH指数pHi——pH监测值;

pHS,min——评价标准值的下限;

pHS,max ——评价标准值的上限;污染物超标倍数Ci ——第i项污染物的监测值;

C0 ——第i项污染物评价标准值; 内梅罗指数Pmax ——单因子污染指数的最高值;

Pi ——第i项污染物的污染指数;

n ——参与评价污染物的项数; 常用的客观赋权法之一:熵值法

熵是信息论中测度一个系统不确定性的量。信息量越大,不确定性就越小,熵也越小,反之,信息量越小,不确定性就越大,熵也越大。熵值法主要是依据各指标值所包含的信息量的大小,利用指标的熵值来确定指标权重的。熵值法的一般步骤为:

(1)、对决策矩阵作标准化处理,得到标准化矩阵,并进行归一化处理得:

(2)、计算第个指标的熵值:。其中。

(3)、计算第个指标的差异系数。对于第个指标,指标值的差异越大,对方案评价的作用越大,熵值越小,反之,差异越小,对方案评价的作用越小,熵值就越大。因此,定义差异系数为:。

(4)、确定指标权重。第个指标的权重为:。

效益型和成本型指标的标准化方法

对于效益型(正向)指标和成本型(逆向)指标,由于这两者是最常见并且使用最广泛的指标,所以,对这两种指标标准化处理的方法也最多,一般的处理方法有:

1 极差变换法

该方法即在决策矩阵中,对于效益型指标,令

=

对于成本型指标,令

=

则得到的矩阵称为极差变换标准化矩阵。其优点为经过极差变换后,均有,且各指标下最好结果的属性值,最坏结果的属性值。该方法的缺点是变换前后的各指标值不成比例。

2 线性比例变换法

即在决策矩阵中,对于效益型指标,令

=

对成本型指标,令

=

=

则矩阵称为线性比例标准化矩阵。该方法的优点是这些变换方式是线性的,且变化前后的属性值成比例。但对任一指标来说,变换后的和不一定同时出现。

3 向量归一化法

即在决策矩阵中,对于效益型指标,令

对于成本型指标,令

则矩阵称为向量归一标准化矩阵。显然,矩阵的列向量的模等于1,即。该方法使,且变换前后正逆方向不变,缺点是它是非线性变换,变换后各指标的最大值和最小值不相同。

4 标准样本变换法

在中,令

其中,样本均值,样本均方差,则得出矩阵,称为标准样本变换矩阵。经过标准样本变换之后,标准化矩阵的样本均值为,方差为。

5 等效系数法

对成本型指标,令

=

该方法的优点是变换前后的指标值成比例,缺点是各指标下方案的最好与最差指标值标准化后不完全相同。

另外,关于效益型指标的标准化处理还有:

=

关于成本型指标的标准化处理还有:

=

固定型指标的标准化方法

对于固定型指标,若设为给定的固定值,则标准化处理的方法主要有以下几种,即令

(415)式的特点是各最优属性值标准化后的值均为1,而各最差属性的值标准化后的值不统一,即不一定都为0。

若设和分别是人为规定的最优方案和最劣方案,在该情形下,还给出了效益型、成本型和固定型指标的新的标准化方法。

对效益型和成本型,有:

对固定型指标则有:

区间型指标的标准化方法

对区间型的指标,其指标标准化处理的方法主要有以下几式:

设,令

或令

显然,还可以简化为:

或令

或令

其中,是指给定的某个固定区间,即属性值越接近该区间越好。

偏离型指标的标准化方法

对越来越偏离某值越好的偏离性指标,一般有如下标准化公式:

或令

(对都有)

或令

偏离型指标是与固定型指标相对立的一种指标类型,它的公式使用可以用固定型指标的公式改造,但在使用时要注意其公式的适用范围。

偏离区间型指标的标准化方法

对偏离区间型指标,有如下标准化的方法:

或令

或令

其中,是某个固定区间,属性值越偏离该区间越好。偏离区间型指标是与区间型指标相对立的一种指标类型。

使用spss计算各指标权重的方法是:将指标的各个数据无量纲化,并对无量纲化的数据通过方差最大化旋转进行因子分析即可计算出各指标的权重。

SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。

输出结果十分美观,存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口。

用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大的方便了中、高级用户。

扩展资料:

spss进行权重分析的优势:

1、操作简便

界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。

2、编程方便

只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。对于常见的统计方法。

SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。

3、功能强大

具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法。

—spss

—权重

欢迎分享,转载请注明来源:品搜搜测评网

原文地址:https://pinsoso.cn/meirong/2025798.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-11-04
下一篇2023-11-04

随机推荐

  • 哪个牌子的化妆品性价比高

    朋友你好!性价比高的化妆品有国产彩妆排行榜前十名卡姿兰——卡姿兰(香港)有限公司2002年培育,2003年开始终端操作,2005年市场开始起色,2006年品牌风生水起,2007年到达顶峰,2008年终端优化,2009年大刀阔斧的消费者品牌提

    2024-04-15
    42400
  • 泊美详细资料大全

    泊美(PURE&MILD)诞生于2001年8月,是日本资生堂旗下专为中国女性所设计的专业植物系护肤品牌。以“Coetic Marché泊美鲜肌荟”为理念,倡导新鲜、多彩、愉悦护肤感受,为希望永青春美丽的女性提供甄选世界天然植物

    2024-04-15
    45900
  • 从香港买回来的妮维雅怎么看生产日期呢?

    妮维雅是国外的产品,要是你朋友是在香港SASA、卓悦、龙城一些上市商场买的绝大多数是正品水货。因为香港是免税的,有很多产品是没有经过海关出售的,所以没有中文说明,不过有很多商品是快过期甚至是已经过期的。最好找一个懂得看批号的人看清了再使用。

    2024-04-15
    29800
  • 莱伯妮黄金精华液含酒精吗

    莱伯妮黄金精华液不含酒精。根据查询相关信息得知,莱伯妮黄金精华液的成分为鱼籽精华以及各种化学成分,没有酒精。LaPrairie是一种护肤产品。在瑞士的蒙特里斯有一座赫赫有名的LaPrairie疗养中心,LaPrairie护肤系列研究所传承了

    2024-04-15
    29500
  • 妮维雅防晒霜怎么样

    为了方便大家理解,小编以来自于旗下的spf30++的这一款蓝色装作为例子来分享,这一款防晒霜它对应的单盒价格为49元,它以突破性的、来自于德国的专利技术作为主基础去打造,所以能有效对抗来自于太阳光中的紫外线照射和伤害,而且还能最大化对抗电脑

    2024-04-15
    33300
  • 小黄瓜水有什么作用

    美白保湿、细致毛孔、细滑爽肤。。。小黄瓜萃取精华富含矿物质、氨基酸、糖蛋白、单宁酸等人体极易吸收的养分,可以使肤色靓丽、红润、洁净、白皙;与此同时,可有效的清热解毒,促进血液循环,对青春痘、粉刺、皱纹、雀斑等问题可以起到修复作用,对发言的皮

    2024-04-15
    38300
  • 兰蔻粉水和红水感肌水光精华露哪个先用?

    首先使用兰蔻粉水。洁面后,首先使用粉水能滋润皮肤,打开肌肤吸收的通道,然后使用水感肌水光针,修护肌肤。兰蔻粉水是一款二次清洁水,主要的功效为补水,最适合干性肌肤使用,缓解皮肤干燥的问题,水乳质地,容易吸收,令肌肤水润细腻。水感肌水光针是一款

    2024-04-15
    33500

发表评论

登录后才能评论
保存