统计学之因子分析.pdf

上传人:赵** 文档编号:20432225 上传时间:2022-06-16 格式:PDF 页数:10 大小:1.01MB
返回 下载 相关 举报
统计学之因子分析.pdf_第1页
第1页 / 共10页
统计学之因子分析.pdf_第2页
第2页 / 共10页
点击查看更多>>
资源描述

《统计学之因子分析.pdf》由会员分享,可在线阅读,更多相关《统计学之因子分析.pdf(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计学之因子分析统计学之因子分析& &多元分析:就是通过多个变量对数据进行分析的方法的统称。多元分析:就是通过多个变量对数据进行分析的方法的统称。多元分析包括:多元分析包括:因子分析因子分析 重回归分析重回归分析LOGISTICLOGISTIC 分析分析主成分分析主成分分析聚类分析聚类分析结构方程模型结构方程模型等等等等所谓因子分析就是将数据背后的潜在的共性因子挖掘出来的一种分析方法。所谓因子分析就是将数据背后的潜在的共性因子挖掘出来的一种分析方法。简单来说,就是通过问卷调查的结果,将受访者的真实想法归纳出来的一种分简单来说,就是通过问卷调查的结果,将受访者的真实想法归纳出来的一种分析方法。析

2、方法。#问卷调查的基础知识问卷调查的基础知识因子分析大多是先通过问卷调查来收集数据,然后再进行分析,所以我们必须因子分析大多是先通过问卷调查来收集数据,然后再进行分析,所以我们必须先掌握问卷调查的相关知识。先掌握问卷调查的相关知识。%抽样方法抽样方法总体:由全部调查对象所组成的集合称为“总体”总体:由全部调查对象所组成的集合称为“总体” 。抽样:从总体中抽出的若干个个体所组成的集合称为“样本”抽样:从总体中抽出的若干个个体所组成的集合称为“样本” 。ByBy thethe way,way, 以总体的为对象的调查称为以总体的为对象的调查称为 “普查”“普查” ; 以样本为对象的调查称为以样本为对

3、象的调查称为 “抽“抽样调查”样调查” 。但是,样本如果不能成为“总体的精确缩影”的话,那么做样本分析就失去意但是,样本如果不能成为“总体的精确缩影”的话,那么做样本分析就失去意义了。义了。 (书(书 1818 页图)页图)抽样方法,就是将样本从总体中抽出的方法的统称。作为代表性的方法,我们抽样方法,就是将样本从总体中抽出的方法的统称。作为代表性的方法,我们主要介绍四种:主要介绍四种: “简单随机抽样法”“简单随机抽样法”“分层抽样法”“分层抽样法”“二阶抽样法”“二阶抽样法”“分层二阶抽样法”“分层二阶抽样法”* *“简单随机抽样法”就是从总体中随机抽取个体的抽样方法。这种方法常常用“简单随

4、机抽样法”就是从总体中随机抽取个体的抽样方法。这种方法常常用来进行像“某大型企业的员工意识调查”来进行像“某大型企业的员工意识调查” ,因为虽然可以拿到全体成员的名册,因为虽然可以拿到全体成员的名册,但是人数过多,不适合进行普查,这是就可以用简单随机抽样法。但是人数过多,不适合进行普查,这是就可以用简单随机抽样法。* *“分层抽样法”“分层抽样法” 它是先将总体按照“出生地”它是先将总体按照“出生地” 、 “出生年代”“出生年代” 、 “职业”或“最“职业”或“最高学历”等属性划分出不同的层,然后再针对每层做简单随机抽样的一种方法。高学历”等属性划分出不同的层,然后再针对每层做简单随机抽样的一

5、种方法。从不同的层得到的调查结果会有比较大的差别,当这些状况能够事前预测到时,从不同的层得到的调查结果会有比较大的差别,当这些状况能够事前预测到时,适合使用这种方法。例如:适合使用这种方法。例如: “喜欢哪类食品”这类问题可能会因“地域”的不同“喜欢哪类食品”这类问题可能会因“地域”的不同而有所不同;而有所不同; “喜欢哪位明星”这类问题可能会因“喜欢哪位明星”这类问题可能会因“出生年代”“出生年代”不同而有所不同。不同而有所不同。* *“二阶抽样法”就是分“二阶抽样法”就是分 2 2 个阶段抽取数据的方法。作为第一阶段,按照“出生个阶段抽取数据的方法。作为第一阶段,按照“出生地”或其他属性进

6、行抽样;第二阶段,对已抽出的每一个区域进行简单随机抽地”或其他属性进行抽样;第二阶段,对已抽出的每一个区域进行简单随机抽样。样。需要注意的是:我们必须知道第一阶段中各区域的准确人数,否则无法进行调需要注意的是:我们必须知道第一阶段中各区域的准确人数,否则无法进行调查;此外,在第一阶段中没有被抽到区域的人们,他们的意见将被我们忽视。查;此外,在第一阶段中没有被抽到区域的人们,他们的意见将被我们忽视。* *“分层二阶抽样法”就是分层抽样法和二阶抽样法相结合的抽样方法。“分层二阶抽样法”就是分层抽样法和二阶抽样法相结合的抽样方法。以上均是随机抽样。定向抽样是一种随机抽样以外的抽样方法,也就是将构以上

7、均是随机抽样。定向抽样是一种随机抽样以外的抽样方法,也就是将构成样本的个体从总体中非等概率地抽取出来的方法。下面介绍几种定向抽样法。成样本的个体从总体中非等概率地抽取出来的方法。下面介绍几种定向抽样法。介绍法:以熟人或朋友为调查对象,获取样本的方法。介绍法:以熟人或朋友为调查对象,获取样本的方法。征召法:以读者意见反馈卡等方式招募调查对象,获得样本的方法。征召法:以读者意见反馈卡等方式招募调查对象,获得样本的方法。拦截法:在商业街或街角等处寻找调查对象,获得样本的方法。拦截法:在商业街或街角等处寻找调查对象,获得样本的方法。%调查方法调查方法邮寄调查邮寄调查 网络调查网络调查 现场调查现场调查

8、 留置调查留置调查 电话调查电话调查RDD(Rondom Digit Dialing)RDD(Rondom Digit Dialing)调查调查%样本容量的标准样本容量的标准样本中的个体数目称为样本容量。样本容量越大,就越接近总体的数量,但不样本中的个体数目称为样本容量。样本容量越大,就越接近总体的数量,但不会超过总体的数目。会超过总体的数目。 “样本容量的统计学最低标准”是不存在的。但是,在问卷“样本容量的统计学最低标准”是不存在的。但是,在问卷调查领域中,通常会有一个“约调查领域中,通常会有一个“约 400400”的最低标准,不过这个标准也不能说是”的最低标准,不过这个标准也不能说是合理的

9、。合理的。 “约“约 400400”只是出于某种考虑而设定的值,并不能无条件的令人信服。”只是出于某种考虑而设定的值,并不能无条件的令人信服。(第(第 3535 页)页)%数据分析的搭配方法数据分析的搭配方法数据分析的搭配方法有两种类型。数据分析的搭配方法有两种类型。探索型探索型 验证性验证性“探索型”的数据分析流程“探索型”的数据分析流程收集手头资料。收集手头资料。试着运用各种分析方法,进行全面分析。试着运用各种分析方法,进行全面分析。如“事后诸葛”般恍然大悟“原来世上还有这样的事”如“事后诸葛”般恍然大悟“原来世上还有这样的事” 。向周围的人公布自己的分析结果。向周围的人公布自己的分析结果

10、。“验证型”的数据分析流程“验证型”的数据分析流程建立假设建立假设为了确认假设是否成立,收集资料,并进行分析。为了确认假设是否成立,收集资料,并进行分析。得出结论,即假设成立与否。得出结论,即假设成立与否。向周围的人公布自己的分析结果。向周围的人公布自己的分析结果。“探索型”的数据分析,只需要手头的数据即可,其优点在于能够简单、快速“探索型”的数据分析,只需要手头的数据即可,其优点在于能够简单、快速的完成分析。另一方面,它也存在弊端,如数据被随意加工、变量间被强加上的完成分析。另一方面,它也存在弊端,如数据被随意加工、变量间被强加上想当然的因果关系,从而可以让“事后诸葛”们乱说一通。更有甚者,

11、便会“为想当然的因果关系,从而可以让“事后诸葛”们乱说一通。更有甚者,便会“为所欲为”了。所欲为”了。“验证型”的数据分析,一定要在调查的最初阶段建立假设,所以着手分析时“验证型”的数据分析,一定要在调查的最初阶段建立假设,所以着手分析时会比较困难,这也正是他的缺点。但是另一方面,假设一旦建立,接下来便是会比较困难,这也正是他的缺点。但是另一方面,假设一旦建立,接下来便是收集数据和分析数据。经过一番分析,如果假设成立,就可以得到一个非常有收集数据和分析数据。经过一番分析,如果假设成立,就可以得到一个非常有说服力的结果,获得周围的认同。即便假设不成立,我们同样可以得到一个事说服力的结果,获得周围

12、的认同。即便假设不成立,我们同样可以得到一个事实“至少这个假设不成立”实“至少这个假设不成立” ,这对指导今后的研究很有帮助,所以绝不能说这是,这对指导今后的研究很有帮助,所以绝不能说这是一个没有意义的数据分析。一个没有意义的数据分析。#调查问卷和问题调查问卷和问题无论是调查问卷的构成还是询问的问题都没有一个所谓的“最佳法则”无论是调查问卷的构成还是询问的问题都没有一个所谓的“最佳法则” ,但是还,但是还是有一些规则能使调查问卷和问题的设计更科学合理一些。是有一些规则能使调查问卷和问题的设计更科学合理一些。在调查问卷中,首先要询问受访者的行为或经验这些“现状”层面的东西,接在调查问卷中,首先要

13、询问受访者的行为或经验这些“现状”层面的东西,接下来再询问感觉啦、想法啦这些“意识”层面的东西,最后询问“属性”层面下来再询问感觉啦、想法啦这些“意识”层面的东西,最后询问“属性”层面的东西。这样的结构才是最佳结构。的东西。这样的结构才是最佳结构。询问“现状”是否接触过、是否拥有、什么时候买的、在哪里买的,等等%问题的分类问题的分类询问“意识”满意或不满意之处、满意或不满意的理由、价值观,等等询问“属性”性别、 年龄、 婚姻状况、 收入、 最高学历、家庭结构,等等调查问卷中的问题大致可分为“单项选择题”调查问卷中的问题大致可分为“单项选择题”、 “多项选择题”“多项选择题” 、 “数量题”“数

14、量题” 、 “文“文字题”等。字题”等。“单项选择题”也就是只允许选择一个选项的问题。当几个问题的选项相同时,“单项选择题”也就是只允许选择一个选项的问题。当几个问题的选项相同时,为了节约纸面空间,建议采取下面的方式为了节约纸面空间,建议采取下面的方式多项选择题,也就是同一道题可以选择多个选项的问题。另外,还有类似下面的这多项选择题,也就是同一道题可以选择多个选项的问题。另外,还有类似下面的这种询问方式种询问方式但是并不推荐大家使用,因为与“可选多项”相比,这种设计要求受访者必须先将但是并不推荐大家使用,因为与“可选多项”相比,这种设计要求受访者必须先将全部选项浏览一遍之后才能作答,这样无形中

15、会增加受访者的负担。全部选项浏览一遍之后才能作答,这样无形中会增加受访者的负担。数量题,也就是需要回答具体数值的问题。这时要用线将每一位数字隔开,以免书数量题,也就是需要回答具体数值的问题。这时要用线将每一位数字隔开,以免书写时出现错误。写时出现错误。文字题,也就是不需要选择选项,而是需要自由作答的问题。文字题,也就是不需要选择选项,而是需要自由作答的问题。%应当避免的问题应当避免的问题不能对于过于隐私的问题问得太具体。不能对于过于隐私的问题问得太具体。如果一定要询问具体值的话,就要另想办法。例如下面的方式会让受访者感到更为如果一定要询问具体值的话,就要另想办法。例如下面的方式会让受访者感到更

16、为亲切。亲切。不能存在表达不明确的问题。不能存在表达不明确的问题。同一问题不能包含两层以上的意思。同一问题不能包含两层以上的意思。比如:比如:QQ 你觉得服务员的制服和服务态度如何?你觉得服务员的制服和服务态度如何?倘若受访者认为“服务态度好,而制服不好”那他该如何作答呢?所以问题要一个倘若受访者认为“服务态度好,而制服不好”那他该如何作答呢?所以问题要一个一个的明确的提出来。一个的明确的提出来。最好不要设置排序问题。最好不要设置排序问题。例如“觉得两者都不错的”或者“没有尝试过某一种”的人将不好作答。例如“觉得两者都不错的”或者“没有尝试过某一种”的人将不好作答。问题的提出关键在于从“受访者

17、角度”出发。如果你是受访者的话,做这份调查问问题的提出关键在于从“受访者角度”出发。如果你是受访者的话,做这份调查问卷会有什么感受。如果你身边的人是受访者的话,他们会协助你完成调查吗。如果卷会有什么感受。如果你身边的人是受访者的话,他们会协助你完成调查吗。如果你已经考虑到这些的话,就没有问题了。你已经考虑到这些的话,就没有问题了。诱导回答的问题。诱导回答的问题。例如:例如:Q.Q. 由于日本的资源紧缺,所以在由于日本的资源紧缺,所以在 2121 世纪,关于科学科技的教育越发显得重世纪,关于科学科技的教育越发显得重要。因此,您对今后的初中理科教育有何看法?要。因此,您对今后的初中理科教育有何看法

18、? 1 1 、应当更丰富一点、应当更丰富一点 2 2 、保持现状就好、保持现状就好注:面对这种提问,很多人都是出于不得已会选“注:面对这种提问,很多人都是出于不得已会选“1 1” 。程度等级太多的问题。程度等级太多的问题。评分的问题。评分的问题。征集自由答案的问题。征集自由答案的问题。当拿到千奇百怪的答案时,你就会意识到您所肩负的工作是多么沉重。当拿到千奇百怪的答案时,你就会意识到您所肩负的工作是多么沉重。%“中值”的存在性“中值”的存在性在进行程度等级的评价时,无论采用哪种方式,都会有包括“中值”和不包括“中在进行程度等级的评价时,无论采用哪种方式,都会有包括“中值”和不包括“中值”的两种情

19、况。值”的两种情况。* *包括中值包括中值* *不包含“中值”不包含“中值”总体来说,包括不包括“中值”都可以,但是不包含中值会出现这样的问题:总体来说,包括不包括“中值”都可以,但是不包含中值会出现这样的问题:必须明确的回答“是”或者“否”必须明确的回答“是”或者“否” ,这会增加受访者的回答难度。,这会增加受访者的回答难度。与含有“中值”的情况相比,其直方图与正态分布的相似度也比较低。与含有“中值”的情况相比,其直方图与正态分布的相似度也比较低。#基础数学知识基础数学知识为了理解因子分析我们有必要先来学习一下数字的基础知识。这部分主要讲讲为了理解因子分析我们有必要先来学习一下数字的基础知识

20、。这部分主要讲讲一些事实性的问题。权且当作“就是这么回事”来理解就好。一些事实性的问题。权且当作“就是这么回事”来理解就好。%相关矩阵相关矩阵相关矩阵,也就是由单相关系数所构成的矩阵。相关矩阵,也就是由单相关系数所构成的矩阵。%单位矩阵单位矩阵单位矩阵,就是主对角线(左上至右下)上的值全为单位矩阵,就是主对角线(左上至右下)上的值全为 1 1,其余的值全为,其余的值全为 0 0。而且同单位矩阵相乘并不会对原来的矩阵产生影响。也就是说这个矩阵就像数而且同单位矩阵相乘并不会对原来的矩阵产生影响。也就是说这个矩阵就像数字里的字里的 1 1 一样。一样。%坐标的“旋转”坐标的“旋转”围绕原点的旋转:围

21、绕原点的旋转:如下图,如下图, 在在 2 2 维坐标上,有一点维坐标上,有一点 p(x, y) ,p(x, y) , 直线直线 opop 长度为长度为 r,r, 直线直线 opop 和和 x x轴的正向的夹角为轴的正向的夹角为 a a。直线直线 opop围绕原点做逆时针方向围绕原点做逆时针方向 b b度的旋转,度的旋转, 到达到达 p p (s,t) (s,t)s = r cos(a + b) = r cos(a)cos(b)s = r cos(a + b) = r cos(a)cos(b) r sin(a)sin(b) (1.1) r sin(a)sin(b) (1.1)t = r sin(

22、a + b) = r sin(a)cos(b) + r cos(a) sin(b) (1.2)t = r sin(a + b) = r sin(a)cos(b) + r cos(a) sin(b) (1.2)其中其中 x = r cos(a) , y = r sin(a) x = r cos(a) , y = r sin(a)代入代入(1.1), (1.2) ,(1.1), (1.2) ,s = x cos(b)s = x cos(b) y sin(b) (1.3) y sin(b) (1.3)t = x sin(b) + y cos(b) (1.4)t = x sin(b) + y cos(

23、b) (1.4)用行列式表示如下用行列式表示如下%特征值和特征向量特征值和特征向量每个矩阵都会有与之相对应的“特征值”和“特征向量”每个矩阵都会有与之相对应的“特征值”和“特征向量” 。例如:。例如:,这说明,这说明的特征向量。的特征向量。是是的特征值,的特征值,是是对应于对应于P P 行行 P P 列的矩阵的特征值和特征方程,原则上讲,存在列的矩阵的特征值和特征方程,原则上讲,存在 P P 组。组。%对称矩阵对称矩阵所谓对称矩阵就是各元素关于对角线对称的矩阵。如此说来,相关矩阵,单位所谓对称矩阵就是各元素关于对角线对称的矩阵。如此说来,相关矩阵,单位矩阵都是对称的矩阵。矩阵都是对称的矩阵。%

24、矩阵的补充矩阵的补充矩阵的书写规则矩阵的书写规则矩阵的加法矩阵的加法矩阵的乘法矩阵的乘法逆矩阵:逆矩阵就是与原矩阵相乘之后得到同型的单位矩阵的那个矩阵。逆矩阵:逆矩阵就是与原矩阵相乘之后得到同型的单位矩阵的那个矩阵。转置矩阵:转置矩阵就是将行和列互换后得到的矩阵。转置矩阵:转置矩阵就是将行和列互换后得到的矩阵。离差平方和、方差、标准差离差平方和、方差、标准差离差平方和离差平方和= =(每个数据(每个数据- -平方值)平方值)2 2相加之和相加之和(总体)方差(总体)方差= =离差平方和离差平方和/ /数据的个数数据的个数(总体)标准差(总体)标准差2 2= =(总体)方差(总体)方差注:在方差

25、中,也有不采用“数据的个数”而采用“数据的个数注:在方差中,也有不采用“数据的个数”而采用“数据的个数-1-1”作为分母”作为分母的情况,我们将其称为样本方差。的情况,我们将其称为样本方差。#主成分分析主成分分析主成分分析和因子分析看起来很相似,很多人都会混淆这两种方法,为了避免主成分分析和因子分析看起来很相似,很多人都会混淆这两种方法,为了避免今后我们也犯类似的错误,本章节主要为大家介绍主成分分析。今后我们也犯类似的错误,本章节主要为大家介绍主成分分析。%主成分分析主成分分析主成分分析和因子分析的区别在于,如果给主成分分析增加一些约束条件,那主成分分析和因子分析的区别在于,如果给主成分分析增加一些约束条件,那么两者就完全相同了。主成分分析,是为了“选出综合实力最强”的一种分析么两者就完全相同了。主成分分析,是为了“选出综合实力最强”的一种分析方法。方法。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁