SPSS之特征筛选与主成分分析

SPSS之特征筛选与主成分分析,第1张

业务上对特征值维度的要求:

统计学模型:3-15个维度,高维度可能导致维度灾难------理论

机器学习模型:50个维度,速度问题------降维

如何降维:

保留重要的特征,剔除不重要的特征

处理流程:

1经验法

2数据分析法(使用yx相关分析,剔除与y无关的变量

3经验法+数据分析法(x与x相关分析)

4数据分析法+经验法(逐步回归法)

5主成分分析(因为前四步,已经把重要的变量筛选出来了,不重要的删除了,剩下的变量意义很模糊)

下面使用 bankloan_binning (提取码:78uh)做个案例:

1经验法(通过业务判断age_group是重要的)

2数据分析法

3经验法+数据分析法

下面将使用统计学方法对变量做整合

4数据法+经验法(删除变量)

5主成分分析(若变量个数仍大于15,对整个结果进行压缩)

看spss主成分分析结果图方法。

1、分析数据依次单击spss的分析降维因子分析。

2、降维分析接着,将评价员工能力的五个指标变量添加到变量选项框。

3、变量设置接着,进行分析方法的设置。点击描述分析,在弹出的描述分析设置上,勾选相关性矩阵中的系数。

结果分析

(1)KMO与巴特利特球形检验

由表可以知,巴特利特球形检验的统计量值为3960473,相应的概率P值为0。在显著性水平下,应拒绝原假设,认为相关系数矩阵与单位矩阵存在显著差异。同时KMO值为0844,根据Kaiser给出的度量KMO的标椎可知问卷题项适合做因子分析。

2)公因子方差

提取值表示每个变量被公因子表达的多少,一般认为,大于07就说明变量被公因子很好地表达。由表可以看出,绝大多数变量的提取值大于085,变量能被公因子很好地表达。

(3)解释总方差

提取方法:主成分分析法

(4)旋转成分矩阵

提取方法:主成分分析法

5)计算因子得分:因子分析是基于研究各题项之间的内部依赖关系,将一些信息重叠、相关性高的变量指标归结为几个不相关的综合因子的多重统计方法。通过SPSS230得出的成分得分系数矩阵,见表,可得到、、、、公因子的得分表达式为:

其中、、、、公因子分别代表基础技能,创新能力,资源运用,合作精神,创新思维

KMO检验用于检查变量间的偏相关性 一般认为该值大于09时效果最佳 07以上尚可,06时效果较差

Bartlett's球形检验用于检验相关阵是否是单位阵 P<001说明指标间并非独立,取值是有关系的。可以进行因子分析

根据上图 可以看出一共提取了3个主成分 可是能解释的方差为69958%

软件默认的是提取特征根大于1的主成分 如果加上第四个主成分的话可以解释的变异度为8626%

所以结合专业知识 可以考虑是不是增加一个主成分。

扩展资料:

软件模块实际上就是将以前单独发行的SPSS AnswerTree软件整合进了SPSS平台。笔者几年前在自己的网站上介绍SPSS 11的新功能时,曾经很尖锐地指出SPSS的产品线过于分散,应当把各种功能较单一的小软件,如AnswerTree、Sample Power等整合到SPSS等几个平台上去。

看来SPSS公司也意识到了这一点,而AnswerTree就是在此背景下第一个被彻底整合的产品。

Classification Tree模块基于数据挖掘中发展起来的树结构模型对分类变量或连续变量进行预测,可以方便、快速的对样本进行细分,而不需要用户有太多的统计专业知识。在市场细分和数据挖掘中有较广泛的应用。

已知该模块提供了CHAID、Exhaustive CHAID和C&RT三种算法,在AnswerTree中提供的QUEST算法尚不能肯定是否会被纳入。

为了方便新老用户的使用,Tree模块在操作方式上不再使用AnswerTree中的向导方式,而是SPSS近两年开始采用的交互式选项卡对话框。但是,整个选项卡界面的内容实际上是和原先的向导基本一致的,另外,模型的结果输出仍然是AnswerTree中标准的树形图,这使得AnswerTree的老用户基本上不需要专门的学习就能够懂得如何使用该模块。

由于树结构模型的方法体系和传统的统计方法完全不同,贸然引入可能会引起读者统计方法体系的混乱。为此,本次编写的高级教程并未介绍该模块,而将在高级教程的下一个版本,以及关于市场细分问题的教材中对其加以详细介绍。

参考资料:

-spss

  提取出来的两个主成分之间是相互独立的,所以他们之间没有包含和被包含的关系。可以把因变量进行标准化后,直接用主成分做自变量,标准化的因变量进行回归。

  SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件。最初软件全称为“社会科学统计软件包”(SolutionsStatistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称SPSS,有Windows和Mac OS X等版本。

欢迎分享,转载请注明来源:品搜搜测评网

原文地址:https://pinsoso.cn/meirong/1926914.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-10-28
下一篇2023-10-28

随机推荐

  • 莱珀妮鱼子酱精华真假

    莱珀妮鱼子酱精华是一款非常受欢迎的美容产品,它所使用的成分包括鲟鱼子和珍珠等天然提取物,被誉为能够改善肌肤质量、提升肌肤光泽度的神奇产品。对于这款产品,关心它真假问题的人们很多,我们从以下几个角度来回答大家的疑问。我们需要知道莱珀妮鱼子酱精

    2024-04-15
    48100
  • 请教一下相宜本草、za、卡尼尔、妮维雅、玉兰油、欧莱雅、百草集的明星产品

    1欧莱雅是做头发产品起家的 染发和头发护理产品是它真正的明星产品 毫无疑问的全球第一镇牌之宝 清润全日保湿水精华 ----- 2 我觉得是玉兰油7重修护那个霜。电视天天打广告的那个3相宜本草洗面的:有控油祛痘洗面膏,这个油性的用很不错,控油

    2024-04-15
    48300
  • 中国风插画包装-国潮插画风格特点

    中国风插画全是封面的是什么书《芥子园画谱》《芥子园画谱》最早成书康熙年间,此后一再翻版,逐渐漫漶。到光绪年间(1875—1909年),需要这部画谱的人很多,而原书因多年翻版,已磨损得不能再印。那时,有一个叫巢勋的画家,也是嘉兴人,他临摹了前

    2024-04-15
    45800
  • 纪梵希口红一般多少钱

    价格普遍在260元左右,如果去各大商场的专柜购买的话,价格普遍在300多块钱左右,如果找代购购买的话,价格可能会便宜一些,但是不敢保证是不是正品,如果找代购购买的话,价格普遍在220元以内。315比较受欢迎,秋冬必备的口红颜色,这款纪梵希#

    2024-04-15
    29700
  • 看过来!精致女孩必备的身体乳合集(二)

    作为一个精致的猪猪女孩,身体乳一定是必不可少的。接下来就给大家推荐一些好用的身体乳吧!aleble皇后身体乳我第一次刚挤出来的时候觉得挺像雪花秀的那个滋润面霜的,放在手心随便你怎么动它都不会“乱跑”,让它涂脖子,绝不会流到肚子上,这款身体乳

    2024-04-15
    27200
  • 润唇膏哪个牌子好

    润唇膏哪个牌子好要说什么护肤品走哪带哪,一定非润唇膏莫属了,随身必定携带一支,公司和家里也分别都留有存货。那么你们知道润唇膏哪个牌子好吗?有关唇膏的使用,个人有时一天涂十几次,最通常的情况是早上唇膏打底,晚上唇膏滋养,一年四季不间断,秋冬使

    2024-04-15
    30800
  • 为什么用玖恩草本紧致套盒的能量源滴肚脐就能减体重。

    其实、减肥效果最好、最快、最根本、最健康、最安全、最环保、最彻底、最无伤害、最无任何副作用的办法就是合理控制饮食:1、控制热量与脂肪。要始终小心食物的热量,在膳食中应减少些肥肉,增加点鱼和家禽。 2、饮食要清淡。要少吃盐,咸的东西吃得越多,

    2024-04-15
    28700

发表评论

登录后才能评论
保存