问题一:因子分析后为什么要进行回归分析 用因子得分FAC1-1做回归,那个因子载荷阵是原变量与因子的相关系数,你可以参考网上的文献,另外新生成的因子是不相关的,不用做相关分析了
问题二:在因子分析中,为什么要对因子进行旋转 主成分分析不能旋转,因子分析才能。很多论文这个方面都误用了 统计专业,为您服务
问题三:为什么在做SPSS因子分析时要进行不止一次的因子的抽取 一次抽取过后,不合适的项目要删除。之后要再抽取,再删除项目。这样就多次了。
当然,如果数据、结构够好,一次也可以探索成良好结构
问题四:spss因子分析为什么要对因子进行旋转? 因子旋转是为了更有利于用现实语言来描述所得因子。正常因子分析得出的因子可能逻辑意义不明显,理解起来很困难。但旋转之后就可能得到有逻辑意义的因子。
问题五:进行因子分析的前提条件是各变量之间应该怎么做 本来想给你截图的,可是传不上来,我就简单说一下哈。
首先你得进行一次预计算,选择菜单里分析――降维――因子分析,跳出主面板,把想分析的变量选到变量框里,然后点确定。这时候输出窗口里会只有一个或两个图表。其中有一个图表是主成分的方差贡献。这个图表里你要找到两个相邻的列(应该是第三列和第四列),其中前一个列指的是单个因子对方差的贡献率,后一个是因子累计贡献率。也就是说前一个列里边数值相加等于100,后一个列里边数值递增,最后一个等于100。假如前一个列里是60,30,10,那么后一列里就是60,90,100两个列之间有一个和的关系。找到这两个列以后,你要找使得累计贡献率达到百分之八十的那个数。这个表的第一列是1,2,3,等等,它代表第几个因子,比如3指的那行就包括第三个因子的方差贡献率,累积到第三个因子的方差贡献率这两个数据。你要找到累计到达百分之八十的那个因子是第几个因子,然后就按提取几个因子进行计算。
通过预计算知道了提取几个因子之后,就开始正式计算。再次打开因子分析的主面板,在最右边一共有五个选项,分别是描述,抽取,旋转,得分,选项。这五个在预计算里边没有用,但是现在要用了。点继续。
点击描述,在对话框里选上初始变量分析,kmo统计量及bartlett球形检验这两个选项,(注意,kmo和bartlett是一个选项,选项名就是很长)这一步是用来判断变量是否适于进行因子分析的。
点击抽取,对话框里最上边的方法就选主成分,分析里选上相关性矩阵,输出选上未旋转的因子解和碎石图两个选项,抽取里选择因子的固定数目,在要提取的因子后边填上你预计算里算出的因子数目。点继续。
旋转里边选最大方差法,输出旋转解。继续。
得分里边选保存为变量,方法为回归,显示因子得分系数矩阵也要打上勾。继续。
确定。
然后就可以分析结果了。
先看kmo和bartlett的结果,kmo统计量越接近1,变量相关性越强,因子分析效果越好。通常07以上为一般,05以下不能接受,就是不适合做因子分析。bartlett检验从检验相关矩阵出发,如果p值,就是sig,比较小的话,一般认为小于005,当然越小越好,就适于因子分析。
如果这两个检验都合格的话,才可以去写因子模型。
为了便于描述,假设我们有两个因子f1,f2,
旋转变换后的因子载荷矩阵会告诉你每个变量用因子表示的系数。比如变量x1=系数1f1+系数2f2,变量2以此类推。
因子得分系数矩阵会告诉你每个因子里各变量占得权重,比如f1=系数1x1+系数2x2+。。。
根据这个我们就能算出因子得分了。
因为之前选择了将因子保存为新变量,所以spss会直接保存两个因子得分为两个新变量,
然后我们不是有一个公式吗
总得分=因子1的方差贡献率因子1的得分+因子2的方差贡献率因子2的得分+
根据这个公式计算一下就可以了。
用spss或者Excel都可以。
希望能对你有帮助哦。
ppv课,大数据培训专家,最专业的大数据培训平台。为你提供最好的spss学习教程哦。
问题六:因子分析后得到的几个成分做回归分析,为什么还要考虑多重共线性 因为他不是用的因子得分,是线性计算的值
理论上用因子得分
问题七:请问 做相关分析前,一定要做因子分析吗?因子分析的目的是什么? 谢谢! 主成分分析和因子分析的区别 :jok:
1,因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成
个变量的线性组合。
2,主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之
间的协方差。
3,主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假
设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同
因子和特殊因子之间也不相关。
4,主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分
一般是独特的;而因子分析中因子不是独特的,可以旋转得到不到的因子。
5,在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特
征值大于1的因子进入分析),而指
定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量
就有几个主成分。
和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有
优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于
使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个
新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主
成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。
总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前
,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分
析一般很少单独使用:a,了解数据。(screening the data),b,和cluster ysis一
起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可
能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回
归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性
。
在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的
对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的
问题八:用SPSS作因子分析,数据为什么要标准化 不标准化 可能会由于不同列的数据本身的大小差异影响结果
比如一列重量数据的范围可能都是几g,数据都是个位数,然后一列数据的计量单位是m,但实际值都是00001起的,因为主成份分析时,只考虑数据,未把计量单位考虑进去,这样两列数据的大小差异很大,会影响结果,因此对数据进行一定的标准化处理,使所有列的数据范围都在正负1之间,这样可以避免数据差异的影响
问题九:实证一定要进行因子分析吗 实证是相对于理论而言的,凡是涉及到数据和统计分析的,都可以叫实证,而因子分析只是众多统计分析方法中的一个而已,自然就不是必须的了。(南心网SPSS实证分析)
问题十:因子分析后为什么要进行回归分析 用因子得分FAC1-1做回归,那个因子载荷阵是原变量与因子的相关系数,你可以参考网上的文献,另外新生成的因子是不相关的,不用做相关分析了
因子分析法与主成分分析法都属于因素分析法,都基于统计分析方法,但两者有较大的区别:主成分分析是通过坐标变换提取主成分,也就是将一组具有相关性的变量变换为一组独立的变量,将主成分表示为原始观察变量的线性组合;而因子分析法是要构造因子模型,将原始观察变量分解为因子的线性组合。通过对上述内容的学习,可以看出因子分析法和主成分分析法的主要区别为:
(1)主成分分析是将主要成分表示为原始观察变量的线性组合,而因子分析是将原始观察变量表示为新因子的线性组合,原始观察变量在两种情况下所处的位置不同。
(2)主成分分析中,新变量Z的坐标维数j(或主成分的维数)与原始变量维数相同,它只是将一组具有相关性的变量通过正交变换转换成一组维数相同的独立变量,再按总方差误差的允许值大小,来选定q个(q<p)主成分;而因子分析法是要构造一个模型,将问题的为数众多的变量减少为几个新因子,新因子变量数m小于原始变量数P,从而构造成一个结构简单的模型。可以认为,因子分析法是主成分分析法的发展。
(3)主成分分析中,经正交变换的变量系数是相关矩阵R的特征向量的相应元素;而因子分析模型的变量系数取自因子负荷量,即。因子负荷量矩阵A与相关矩阵R满足以下关系:
其中,U为R的特征向量。
在考虑有残余项ε时,可设包含εi的矩阵ρ为误差项,则有R − AAT = ρ。
在因子分析中,残余项应只在ρ的对角元素项中,因特殊项只属于原变量项,因此,的选择应以ρ的非对角元素的方差最小为原则。而在主成分分析中,选择原则是使舍弃成分所对应的方差项累积值不超过规定值,或者说被舍弃项各对角要素的自乘和为最小,这两者是不通的。
来自: 带呀带尾呀 (数据小生、数字营销、新媒体)
主成分分析与因子分析的区别
1 目的不同: 因子分析把诸多变量看成由对每一个变量都有作用的一些公共因子和仅对某一个变量有作用的特殊因子线性组合而成,因此就是要从数据中控查出对变量起解释作用的公共因子和特殊因子以及其组合系数;主成分分析只是从空间生成的角度寻找能解释诸多变量变异的绝大部分的几组彼此不相关的新变量(主成分)。
2 线性表示方向不同: 因子分析是把变量表示成各公因子的线性组合;而主成分分析中则是把主成分表示成各变量的线性组合。
3 假设条件不同:主成分分析中不需要有假设;因子分析的假设包括:各个公共因子之间不相关,特殊因子之间不相关,公共因子和特殊因子之间不相关。
4 提取主因子的方法不同:因子分析抽取主因子不仅有主成分法,还有极大似然法,主轴因子法,基于这些方法得到的结果也不同;主成分只能用主成分法抽取。
5 主成分与因子的变化:当给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的;而因子分析中因子不是固定的,可以旋转得到不同的因子。
6 因子数量与主成分的数量:在因子分析中,因子个数需要分析者指定(SPSS根据一定的条件自动设定,只要是特征值大于1的因子主可进入分析),指定的因子数量不同而结果也不同;在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分(只是主成分所解释的信息量不等)。
7 功能:和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势;而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这种情况也可以使用因子得分做到,所以这种区分不是绝对的。
1 、聚类分析
基本原理:将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一类中的元素之间的相似性比其他类的元素的相似性更强。目的在于使类间元素的同质性最大化和类与类间元素的异质性最大化。
常用聚类方法:系统聚类法,K-均值法,模糊聚类法,有序样品的聚类,分解法,加入法。
注意事项:1 系统聚类法可对变量或者记录进行分类,K-均值法只能对记录进行分类;
2 K-均值法要求分析人员事先知道样品分为多少类;
3 对变量的多元正态性,方差齐性等要求较高。
应用领域:细分市场,消费行为划分,设计抽样方案等
2、判别分析
基本原理:从已知的各种分类情况中总结规律(训练出判别函数),当新样品进入时,判断其与判别函数之间的相似程度(概率最大,距离最近,离差最小等判别准则)。
常用判别方法:最大似然法,距离判别法,Fisher判别法,Bayes判别法,逐步判别法等。
注意事项:1 判别分析的基本条件:分组类型在两组以上,解释变量必须是可测的;
2 每个解释变量不能是其它解释变量的线性组合(比如出现多重共线性情况时,判别权重会出现问题);
3 各解释变量之间服从多元正态分布(不符合时,可使用Logistic回归替代),且各组解释变量的协方差矩阵相等(各组协方方差矩阵有显著差异时,判别函数不相同)。
相对而言,即使判别函数违反上述适用条件,也很稳健,对结果影响不大。
应用领域:对客户进行信用预测,寻找潜在客户(是否为消费者,公司是否成功,学生是否被录用等等),临床上用于鉴别诊断。
3、 主成分分析/ 因子分析
主成分分析基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个综合指标(主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的。
因子分析基本原理:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子。(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)
求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知)。
(实际研究中,总体协方差阵与相关阵是未知的,必须通过样本数据来估计)
求解因子载荷的方法:主成分法,主轴因子法,极大似然法,最小二乘法,a因子提取法。
注意事项:1 由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;
2 对于度量单位或是取值范围在同量级的数据,可直接求协方差阵;对于度量单位不同的指标或是取值范围彼此差异非常大的指标,应考虑将数据标准化,再由协方差阵求主成分;
3主成分分析不要求数据来源于正态分布;
4 在选取初始变量进入分析时应该特别注意原始变量是否存在多重共线性的问题(最小特征根接近于零,说明存在多重共线性问题)。
5 因子分析中各个公共因子之间不相关,特殊因子之间不相关,公共因子和特殊因子之间不相关。
应用领域:解决共线性问题,评价问卷的结构效度,寻找变量间潜在的结构,内在结构证实。
4、对应分析/最优尺度分析
基本原理:利用降维的思想以达到简化数据结构的目的,同时对数据表中的行与列进行处理,寻求以低维图形表示数据表中行与列之间的关系。
对应分析:用于展示变量(两个/多个分类)间的关系(变量的分类数较多时较佳);
最优尺度分析:可同时分析多个变量间的关系,变量的类型可以是无序多分类,有序多分类或连续性变量,并 对多选题的分析提供了支持。
5、典型相关分析
基本原理:借用主成分分析降维的思想,分别对两组变量提取主成分,且使从两组变量提取的主成分之间的相关程度达到最大,而从同一组内部提取的各主成分之间互不相关。
欢迎分享,转载请注明来源:品搜搜测评网