因子成分教育

主成分分析和因子分析 用spss实现

提问者:用户RkawZOaF 发布时间: 2024-11-19 06:42:40 阅读时间: 2分钟

最佳答案

一、主成分分析

(1)问题提出

在问题研究中,为了不遗漏和准确起见,往往会面面俱到,取得大量的指标来进行分析。比如为了研究某种疾病的影响因素,我们可能会收集患者的人口学资料、病史、体征、化验检查等等数十项指标。如果将这些指标直接纳入多元统计分析,不仅会使模型变得复杂不稳定,而且还有可能因为变量之间的多重共线性引起较大的误差。有没有一种办法能对信息进行浓缩,减少变量的个数,同时消除多重共线性?

这时,主成分分析隆重登场。

(2)主成分分析的原理

主成分分析的本质是坐标的旋转变换,将原始的n个变量进行重新的线性组合,生成n个新的变量,他们之间互不相关,称为n个“成分”。同时按照方差最大化的原则,保证第一个成分的方差最大,然后依次递减。这n个成分是按照方差从大到小排列的,其中前m个成分可能就包含了原始变量的大部分方差(及变异信息)。那么这m个成分就成为原始变量的“主成分”,他们包含了原始变量的大部分信息。

注意得到的主成分不是原始变量筛选后的剩余变量,而是原始变量经过重新组合后的“综合变量”。

我们以最简单的二维数据来直观的解释主成分分析的原理。假设现在有两个变量X1、X2,在坐标上画出散点图如下:

可见,他们之间存在相关关系,如果我们将坐标轴整体逆时针旋转45°,变成新的坐标系Y1、Y2,如下图:

根据坐标变化的原理,我们可以算出:

Y1 = sqrt(2)/2 * X1 + sqrt(2)/2 * X2

Y2 = sqrt(2)/2 * X1 - sqrt(2)/2 * X2

其中sqrt(x)为x的平方根。

通过对X1、X2的重新进行线性组合,得到了两个新的变量Y1、Y2。

此时,Y1、Y2变得不再相关,而且Y1方向变异(方差)较大,Y2方向的变异(方差)较小,这时我们可以提取Y1作为X1、X2的主成分,参与后续的统计分析,因为它携带了原始变量的大部分信息。

至此我们解决了两个问题:降维和消除共线性。

对于二维以上的数据,就不能用上面的几何图形直观的表示了,只能通过矩阵变换求解,但是本质思想是一样的。

二、因子分析

(一)原理和方法:

因子分析是主成分分析的扩展。

在主成分分析过程中,新变量是原始变量的线性组合,即将多个原始变量经过线性(坐标)变换得到新的变量。

因子分析中,是对原始变量间的内在相关结构进行分组,相关性强的分在一组,组间相关性较弱,这样各组变量代表一个基本要素(公共因子)。通过原始变量之间的复杂关系对原始变量进行分解,得到公共因子和特殊因子。将原始变量表示成公共因子的线性组合。其中公共因子是所有原始变量中所共同具有的特征,而特殊因子则是原始变量所特有的部分。因子分析强调对新变量(因子)的实际意义的解释。

举个例子:

比如在市场调查中我们收集了食品的五项指标(x1-x5):味道、价格、风味、是否快餐、能量,经过因子分析,我们发现了:

x1 = 0.02 * z1 + 0.99 * z2 + e1

x2 = 0.94 * z1 - 0.01 * z2 + e2

x3 = 0.13* z1 + 0.98 * z2 + e3

x4 = 0.84 * z1 + 0.42 * z2 + e4

x5 = 0.97 * z1 - 0.02 * z2 + e1

(以上的数字代表实际为变量间的相关系数,值越大,相关性越大)

第一个公因子z1主要与价格、是否快餐、能量有关,代表“价格与营养”

第二个公因子z2主要与味道、风味有关,代表“口味”

e1-5是特殊因子,是公因子中无法解释的,在分析中一般略去。

同时,我们也可以将公因子z1、z2表示成原始变量的线性组合,用于后续分析。

(二)使用条件:

(1)样本量足够大。通常要求样本量是变量数目的5倍以上,且大于100例。

(2)原始变量之间具有相关性。如果变量之间彼此独立,无法使用因子分析。在SPSS中可用KMO检验和Bartlett球形检验来判断。

(3)生成的公因子要有实际的意义,必要时可通过因子旋转(坐标变化)来达到。

三、主成分分析和因子分析的联系与区别

联系:两者都是降维和信息浓缩的方法。生成的新变量均代表了原始变量的大部分信息且互相独立,都可以用于后续的回归分析、判别分析、聚类分析等等。

区别:

(1)主成分分析是按照方差最大化的方法生成的新变量,强调新变量贡献了多大比例的方差,不关心新变量是否有明确的实际意义。

(2)因子分析着重要求新变量具有实际的意义,能解释原始变量间的内在结构。

大家都在看
发布时间:2024-11-19
最小因子定律:低于某种生物需要的最小量的任何特定因子,是决定该种生物生存和分布的根本因素.限制因子定律:因子处于最小量时,可以成为生物的限制因子,同样因子过量时,也可以成为生物的限制因子.耐受性定律:任何一个生态因子在数量上或质量上的不足或。
发布时间:2024-11-19
JACS由美国化学会创办于1879年,到2019年已经有130年历史。2011年影响因子为9.907,出版文章数3176篇,总引用数408,307次。2012年影响因子为10.677,出版文章数3099篇,总引用数431,286次。2013。
发布时间:2024-11-19
校正因子的计算公式是f=fi/fs=(mi/Ai)/(ms/As)=(As*mi)/(Ai*ms),校正因子(色谱法的专业术语,一般常用于气相色谱GC和液相色谱HPLC)由于同一检测器对不同物质的响应值不同,所以当相同质量的不同物质通过检测。
发布时间:2024-11-19
在数学中,函数是建立两个变量之间关系的基本工具。而因子,则是解析函数性质的一个重要概念。简单来说,函数的因子就是能够整除函数的某个表达式。当我们谈论数学函数的因子时,通常是在多项式函数的背景下。一个多项式函数的因子,是指一个或多个多项式,。
发布时间:2024-11-19
在数学中,特别是在代数与数论领域,因子是一个非常重要的概念。本文旨在探讨在函数的语境下,因子是如何被定义和运用的。因子,简单来说,就是能够整除给定整数的数。在函数的世界里,因子概念被抽象化,用以描述函数中的某些特定部分,这些部分可以独立地。
发布时间:2024-11-19
在R语言中,因子是用于存储分类数据的特殊类型。然而,在某些情况下,我们可能需要将因子转换为常规的数值或字符向量以便进行进一步的操作。下面将详细介绍如何将因子转换为向量的方法。总结来说,将因子转换为向量主要涉及两个步骤:首先,确认因子的类型。
发布时间:2024-11-19
槟榔成分槟榔主要含槟榔碱及少量槟榔次碱、去甲基槟榔碱、去甲基槟榔次碱、异去甲基槟榔次碱、槟榔副碱、高槟榔碱等。此外,尚含鞣质、脂肪、氨基酸和糖类等。。
发布时间:2024-11-17
高级语言基本成分有:数据成分、运算成分、控制成分和传输成分。数据成分:用于描述程序所涉及的对象——数据 运算成分:用以描述程序中所包含的运算控制成分:用以控制程序中所含语句的执行顺序传输成分:用以描述程序中的数据传输操作。。
发布时间:2024-11-15
体育分数换算方法是体育本科综合分以750分为满分计算,具体折算方法:本科综合分=考生总分×50%+术科考试成绩×7.5×50%。体育专科综合分以750分为满分计算,具体折算方法:专科综合分=考生总分×50%+术科考试成绩×4.5×50%。。
发布时间:2024-10-29 21:54
1、我们先将阿拉德之怒游戏打开,来到游戏当中后,如图所示。2、点击右下角的【背包】,在背包里进行强化,之后我们在进入的界面,直接点击一个要强化的装备,不用的装备无需强化,强化就强化有用的,如图所示。3、然后会弹出这件装备的详细信息。
发布时间:2024-10-31 11:13
多少座山的崔嵬也不能勾勒出您的伟岸;多少个超凡的岁月也不能刻画出您面容的风霜,外公,谢谢您为我做的一切。 永远我都会记得,在我肩上的双手,风起的时候,有多么温热;永远我都会记得,伴我成长的背影,用你的岁月换成我无忧的快乐! 我的脉博里流。
发布时间:2024-10-31 13:22
《幽灵公主》的女主角名字叫珊。珊是宫崎骏电影《幽灵公主》的女主角。脸上常戴面具,身披狼皮,手持长矛。被人类遗弃在森林,后被摩洛族的白狼神(莫娜)收养,与白狼共同守护着森林和麒麟兽。。
发布时间:2024-10-31 01:22
生气的时候哺乳对宝宝是有影响的,主要是因为生气的时候内分泌会受到影响,分泌一些有害物质,有还物质进入到奶水中就会影响宝宝的正常发育,对于抵抗力比较弱的宝宝就。
发布时间:2024-11-03 11:39
男性尿道炎是一种较为率较为高的病症,这类病症关键是由于男士沒有留意男性生殖器的环境卫生问题及其夫妻生活不干净的造成的,是归属于细菌感染类的发炎。一般男性感染。
发布时间:2024-10-30 20:14
单纯性出現左腿肿,需要以外有没有最近的外伤性,假如以外了外伤性,则需要看两边身体皮温有没有出现异常,远侧主动脉心搏有没有出现异常。假如两边皮温度差别非常大,。
发布时间:2024-10-01 14:20
目前没找到什么电影有个叫杨天真的。但是一部蛮火的电视剧《会痛的17岁》里面女主就叫杨天真。讲述了一个少女爱情懵懂时期对爱情的追求,葵之来自离异家庭,可谓从小目睹家庭的颠沛流离。她没有见过生父,一直跟妈妈住在一起。而妈妈频繁地更换“爸爸”。
发布时间:2024-10-30 11:05
人的身体是一个复杂的生理系统,如果生病,就会影响身体健康。中药方剂恰恰可以在治愈病症的同时顺带调理修复其它受损的器官机能,是很多患者的福音,今天我们就来介绍。
发布时间:2024-10-31 06:17
1、岩石圈的平均厚度:60~120千米。2、岩石圈,地质学专业术语,是地球上部相对于软流圈而言的坚硬的岩石圈层。厚约60~120公里,为地震高波速带。包括地壳的全部和上地幔的顶部,由花岗质岩、玄武质岩和超基性岩组成。其下为地震波低速带。
发布时间:2024-11-11 12:01
有可能只是简单的皮肤粗糙问题。因为我们大家都知道,婴幼儿的皮肤是非常娇嫩的,因此如果父母带他外出的时候,尤其是在暴晒或者是冬天的冷风强吹下,没有做好皮肤护理工作的话,就会造成皮肤颜色不均匀。2 、很有可能是因为宝宝的营养不良。因为宝宝身体。