1、原理不同:
主成分分析是利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),即每个主成分都是原始变量的线性组合,使得主成分比原始变量具有某些更优越的性能,从而达到简化系统结构,抓住问题实质的目的。
而因子分析更倾向于从数据出发,描述原始变量的相关关系,是由研究原始变量相关矩阵内部的依赖关系出发,把错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。
2、线性表示方向不同:
主成分分析中是把主成分表示成各变量的线性组合,而因子分析是把变量表示成各公因子的线性组合。
3、假设条件不同:
主成分分析不需要有假设条件;而因子分析需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子之间也不相关,共同因子和特殊因子之间也不相关。
4、主成分的数量不同
主成分分析的主成分的数量是一定的,一般有几个变量就有几个主成分(只是主成分所解释的信息量不等),实际应用时会根据碎石图提取前几个主要的主成分。而因子分析的因子个数需要分析者指定,指定的因子数量不同而结果也不同。
5、应用范围不同
在实际的应用过程中,主成分分析常被用作达到目的的中间手段,而非完全的一种分析方法,提取出来的主成分无法清晰的解释其代表的含义。而因子分析就是一种完全的分析方法,可确切的得出公共因子。
-因子分析
-主成分分析
个人认为些都是数据处理应用的软件,其中excel界面最为友好,但功能是在太过单一,仅适用于日常的简单数据处理,不适于较复杂的模型分析,因此科研上应用不多;matlab采用图形界面,功能比较强大,目前研究中应用最广;spss和sas都有比较强的专业性,前者主要用于社科类研究,后者主要用于自然科学及经济的研究方面,另外spss也采用图形界面,友好性方面要强于全部由编程语言进行操作的sas,但spss的主要缺点是数据输出,不能用word等文字处理工具直接打开。 以下是我找到的一些资料,比较详细,楼主可以参考。
MATLAB 的名称源自 Matrix Laboratory ,它是一种科学计算软件,专门以矩阵的形式处理数据。 MATLAB 将高性能的数值计算和可视化集成在一起,并提供了大量的内置函数,从而被广泛地应用于科学计算、控制系统、信息处理等领域的分析、仿真和设计工作,而且利用 MATLAB 产品的开放式结构,可以非常容易地对 MATLAB 的功能进行扩充,从而在不断深化对问题认识的同时,不断完善 MATLAB 产品以提高产品自身的竞争能力。
目前 MATLAB 产品族可以用来进行:
数值分析
数值和符号计算
工程与科学绘图
控制系统的设计与方针
数字图像处理
数字信号处理
通讯系统设计与仿真
财务与金融工程
MATLAB 是 MATLAB 产品家族的基础,它提供了基本的数学算法,例如矩阵运算、数值分析算法, MATLAB 集成了 2D 和 3D 图形功能,以完成相应数值可视化的工作,并且提供了一种交互式的高级编程语言—— M 语言,利用 M 语言可以通过编写脚本或者函数文件实现用户自己的算法。
MATLAB Compiler 是一种编译工具,它能够将那些利用 MATLAB 提供的编程语言—— M 语言编写的函数文件编译生成为函数库、可执行文件 COM 组件等等。这样就可以扩展 MATLAB 功能,使 MATLAB 能够同其他高级编程语言例如 C/C++ 语言进行混合应用,取长补短,以提高程序的运行效率,丰富程序开发的手段。
利用 M 语言还开发了相应的 MATLAB 专业工具箱函数供用户直接使用。这些工具箱应用的算法是开放的可扩展的,用户不仅可以查看其中的算法,还可以针对一些算法进行修改,甚至允许开发自己的算法扩充工具箱的功能。目前 MATLAB 产品的工具箱有四十多个,分别涵盖了数据获取、科学计算、控制系统设计与分析、数字信号处理、数字图像处理、金融财务分析以及生物遗传工程等专业领域。
Simulink 是基于 MATLAB 的框图设计环境,可以用来对各种动态系统进行建模、分析和仿真,它的建模范围广泛,可以针对任何能够用数学来描述的系统进行建模,例如航空航天动力学系统、卫星控制制导系统、通讯系统、船舶及汽车等等,其中了包括连续、离散,条件执行,事件驱动,单速率、多速率和混杂系统等等。 Simulink 提供了利用鼠标拖放的方法建立系统框图模型的图形界面,而且 Simulink 还提供了丰富的功能块以及不同的专业模块集合,利用 Simulink 几乎可以做到不书写一行代码完成整个动态系统的建模工作。
Stateflow 是一个交互式的设计工具,它基于有限状态机的理论,可以用来对复杂的事件驱动系统进行建模和仿真。 Stateflow 与 Simulink 和 MATLAB 紧密集成,可以将 Stateflow 创建的复杂控制逻辑有效地结合到 Simulink 的模型中。
在 MATLAB 产品族中,自动化的代码生成工具主要有 Real-Time Workshop ( RTW )和 Stateflow Coder ,这两种代码生成工具可以直接将 Simulink 的模型框图和 Stateflow 的状态图转换成高效优化的程序代码。利用 RTW 生成的代码简洁、可靠、易读。目前 RTW 支持生成标准的 C 语言代码,并且具备了生成其他语言代码的能力。整个代码的生成、编译以及相应的目标下载过程都是自动完成的,用户需要做得仅仅使用鼠标点击几个按钮即可。 MathWorks 公司针对不同的实时或非实时操作系统平台,开发了相应的目标选项,配合不同的软硬件系统,可以完成快速控制原型( Rapid Control Prototype )开发、硬件在回路的实时仿真( Hardware-in-Loop )、产品代码生成等工作。
另外, MATLAB 开放性的可扩充体系允许用户开发自定义的系统目标,利用 Real-Time Workshop Embedded Coder 能够直接将 Simulink 的模型转变成效率优化的产品级代码。代码不仅可以是浮点的,还可以是定点的。
MATLAB 开放的产品体系使 MATLAB 成为了诸多领域的开发首选软件,并且, MATLAB 还具有 300 余家第三方合作伙伴,分布在科学计算、机械动力、化工、计算机通讯、汽车、金融等领域。接口方式包括了联合建模、数据共享、开发流程衔接等等。
MATLAB 结合第三方软硬件产品组成了在不同领域内的完整解决方案,实现了从算法开发到实时仿真再到代码生成与最终产品实现的完整过程
主要的典型应用包括:
控制系统的应用与开发——快速控制原型与硬件在回路仿真的统一平台 dSPACE
信号处理系统的设计与开发——全系统仿真与快速原型验证, TI DSP 、 Lyrtech 等信号处理产品软硬件平台
通信系统设计与开发——结合 RadioLab 3G 和 Candence 等产品
机电一体化设计与开发——全系统的联合仿真,结合 Easy 5 、 Adams 等
本人用得比较多的模块式:base, stat,insight, em, ets模块(针对82,9的liscense不全,没用过),逐一点评:
base:功能强大,sas之本。对于一个真正的高手而言,base+iml就可以实现绝大多数功能了,他在数据管理和数据前期处理方面的强大性能是我非常喜爱的。当初处理+分析100万条通话记录的时候,手头也只有sas能够胜任,excel的六万多条限制和spss奇慢无比的速度实在受不了。宏也是非常得好用,几千个数据文件的导入拆分只需点击一下run。还有逻辑库的设定实在是非常的方便。另外base proc sql比MS SQL Server跑Sql还要快,可见sas底层做的技术之好!
stat:统计模块,够用就好。常用的统计功能在这里都能实现了,基本相当于spss了(速度远过,常用功能略逊,特殊功能较多)。Analyst是它的可视化界面,虽然方便,但是省略了太多的功能,连因子分析都不能做,不得不说遗憾。当然了,对于大多数用户来说,恐怕连因子分析和主成分分析都分不清楚,还是不要让他们做得好!
insight:方便灵活。看名字就知道,互动式数据分析,最适合用来观察数据,探索性数据分析,非常得方便,缺点是结果好像无法保存。
em:强大,美观,昂贵!数据挖掘模块,一年的租借费用据说是$1million,乖乖!不过实在是sas的巅峰之作,目前最优秀的数据挖掘软件!Insight也被集成为子模块之一。
ets:终于到时间序列了,比Eviews要强大,不过可惜绝大多数的功能要编程,菜单可以做一部分,太少的一部分。
iml:好东西,用于矩阵运算,可以当个matlab用,正准备学
总而言之:sas是给懂得人用的,界面不友好,大多数要编程,这正是sas公司的良苦用心!统计不是那么容易玩的,很多人模型前提假设都没搞懂,就在那里瞎做,用excel,spss还容易,sas就难了。
SPSS是软件英文名称的首字母缩写,原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。
SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于20世纪60年代末研制,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部。1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。迄今SPSS软件已有30余年的成长历史。全球约有25万家产品用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件。
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。用户只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。是非专业统计人员的首选统计软件。在众多用户对国际常用统计软件SAS、BMDP、GLIM、GENSTAT、EPILOG、MiniTab的总体印象分的统计中,其诸项功能均获得最高分。 SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大的方便了中、高级用户。
SPSS输出结果虽然漂亮,但不能为WORD等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这可以说是SPSS软件的缺陷。
欢迎分享,转载请注明来源:品搜搜测评网