数学模型讲座因子分析精.ppt

上传人:石*** 文档编号:65056594 上传时间:2022-12-02 格式:PPT 页数:29 大小:1.68MB
返回 下载 相关 举报
数学模型讲座因子分析精.ppt_第1页
第1页 / 共29页
数学模型讲座因子分析精.ppt_第2页
第2页 / 共29页
点击查看更多>>
资源描述

《数学模型讲座因子分析精.ppt》由会员分享,可在线阅读,更多相关《数学模型讲座因子分析精.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、数学模型讲座因子分析第1页,本讲稿共29页 因子分析是主成分分析的推广和发展,它也是多元统计中处理降维的一种方法。因子分析是研究相关阵或协差阵的内部依赖关系,将多个变量综合为少数几个因子,再现原始变量与因子之间的关系。形成和发展:1904 年Charles Spearman 的论文 对智力测验得分进行的统计分析 早期主要用于心理学和教育学方面的问题 目前:经济学、社会学、考古学、生物学、医学及体育科学第2页,本讲稿共29页实例实例实例实例1 1(1)为了解学生的学习能力,观测了n 个学生p 个科目的成绩,用X1,X2,Xp 表示科目(例如代数、几何、语文、英语,)可以认为各科目有两部分组成:其

2、中F 是对所有的Xi 都起作用的公共因子,它表示智能高低的因子;系数ai 称为因子载荷,表示第i 各科目在智能高低上的体现;i 是科目变量特有的特殊因子,描述原始变量.这就是一个最简单的因子模型;(2).推广到m 个因子,如数学因子、记忆因子、计算因子等,分别记为F1,F2,Fm。这就是一个因子分析模型.第3页,本讲稿共29页实例实例2 2 调查青年对婚姻家庭的态度,抽取n 个青年回答了50个问题的答卷,这些问题可归纳为如下的几个方面:如对相貌的重视,对孩子的观点、对老人的态度等实例实例3 3考察人体的五项生理指标:收缩压、舒张压、心跳间隔、呼吸间隔和舍下温度。从生理学知识,这五项指标是受植物

3、神经支配的,植物神经又分为交感神经和副交感神经,因此这五项指标也可以用因子分析模型去处理 第4页,本讲稿共29页因子分析的主要应用因子分析的主要应用(1).寻求基本结构,简化观测系统,将具有错综复杂关系的对象(变量或样本)综合为少数几个因子(不可观测的随机变量),以再现因子与原始变量之间的内在联系(2).用于分类,对变量或样本进行分类.R R型和型和Q Q型因子分析型因子分析(1).R R型型 从变量的相关阵出发,找出控制所有变量的几个公共因子,用以对变量或样本进行分类。(2).Q Q型型 从样本的相相似据阵出发,找出控制所有样本的几个主要因素。第5页,本讲稿共29页因子分析与主成分分析的区别

4、因子分析与主成分分析的区别(1).主成分分析不能作为一个模型,只是变量变换,而因子分析需要构造模型(2).主成分的个数和变量的个数相同,它是将一组具有相关的关系的变量变换为一组互不相关的变量,而因子分析是要用尽可能少的的公因子,以便构造一个简单的因子模型(3).主成分表示为原始变量的线性组合,而因子分析是将原始变量表示为公因子和特殊因子的线性组合。第6页,本讲稿共29页R型因子分析的数学模型用矩阵表示因子分析的数学模型因子分析的数学模型第7页,本讲稿共29页简记为且满足第8页,本讲稿共29页 为任一个m 阶的正交阵,上式仍满足约束条件因子分析每个相应的系数不是唯一的,即因子载荷阵不是唯一的 通

5、过模型 以F 代替X,由于mp,或 mn,从而达到简化变量维数目的因子分析的目的因子分析的目的第9页,本讲稿共29页正交因子模型中各统计量的意义因子载荷的统计意义因子载荷的统计意义第i 个变量与第j 个公共因子的相关系数。用统计学术语叫权重,表示Xi 依赖Fj 的分量第10页,本讲稿共29页因子载荷据阵A中各行元素的平方和记为称为变量Xi 的共同度共同度公共因子方差公共因子方差剩余方差剩余方差变量共同度的统计意义第11页,本讲稿共29页因子载荷据阵A中各列元素的平方和记为表示第j 个因子对所有分量的总影响,称为第j 个因子对X 的贡献,它是衡量第j 个因子相对重要性的指标公共因子Fj方差的统计

6、意义第12页,本讲稿共29页因子载荷阵的估计方法主成分法主成分法 主因子法主因子法 极大似然法极大似然法设样本的协差阵的特征值和特征向量分别为:则协差阵可分解为第13页,本讲稿共29页其中分量A和D就是因子模型的一个解,A中的第j 列和X中的第j个主成分的系数相差一个倍数。故此解常称为因子模型的主成分解。当最后p-m个特征值较小时,协差阵可以近似的分解为第14页,本讲稿共29页公因子个数的确定方法1)根据实际问题的意义或专业理论知识2)用确定主成分个数的原则第15页,本讲稿共29页因子旋转因子旋转因子旋转因子旋转 用一个正交阵右乘A,使旋转后的因子载荷阵结构简化,即使得每个变量仅在一个公共因子

7、上有较大的载荷,而在其余的因子上载荷比较小。方差最大的正交旋转方差最大的正交旋转使得旋转后的所得到的因子载荷阵的总方差达到最大值.第16页,本讲稿共29页因子得分因子得分Thomson 回归法第17页,本讲稿共29页因子分析的步骤 计算所选原始变量的相关系数矩阵计算所选原始变量的相关系数矩阵 相关系数矩阵描述了原始变量之间的相关关系。可以帮助判断原始变量之间是否存在相关关系,这对因子分析是非常重要的,因为如果所选变量之间无关系,做因子分析是不恰当的。并且相关系数矩阵是估计因子结构的基础。选择分析的变量选择分析的变量 用定性分析和定量分析的方法选择变量,因子分析的前提条件是观测变量间有较强的相关

8、性,因为如果变量之间无相关性或相关性较小的话,他们不会有共享因子,所以原始变量间应该有较强的相关性。第18页,本讲稿共29页 提取公共因子提取公共因子 这一步要确定因子求解的方法和因子的个数。需要根据研究者的设计方案或有关的经验或知识事先确定。因子个数的确定可以根据因子方差的大小。只取方差大于1(或特征值大于1)的那些因子,因为方差小于1的因子其贡献可能很小;按照因子的累计方差贡献率来确定,一般认为要达到60才能符合要求;因子旋转因子旋转 通过坐标变换使每个原始变量在尽可能少的因子之间有密切的关系,这样因子解的实际意义更容易解释,并为每个潜在因子赋予有实际意义的名字。第19页,本讲稿共29页

9、计算因子得分计算因子得分 求出各样本的因子得分,有了因子得分值,则可以在许多分析中使用这些因子,例如以因子的得分做聚类分析的变量,做回归分析中的回归因子。第20页,本讲稿共29页因子分析计算步骤与实例分析n 对我国30个省市自治区的农业生产情况作因子分析。从农业生产条件和生产结果及效益出发,选取六项指标分别为:X1乡村劳动力人口(万人)、X2人均经营耕地面积(亩)、X3户均生产性固定资产原值(元)、X4家庭基本纯收入(元)、X5人均农业总产值(千元/人)、X6增加值占总产值比重(%),原始资料数据如下页表:第21页,本讲稿共29页序号序号地地 区区X1X2X3X4X5X61北 京66.90.9

10、32972.413290.732.52549.72天 津80.21.644803.542871.621.77449.63河 北1621.82.034803.542871.810.8004544山 西635.42.762257.661499.140.55556.25内蒙古514.110.175834.941550.150.905166.46辽 宁605.12.963108.862059.351.475253.17吉 林534.24.734767.511940.461.115463.18黑龙江494.88.245573.022075.421.628357.89上 海661.021660.03457

11、1.813.044835.610江 苏1530.21.262826.862868.331.192150.611浙 江1123.10.945494.233289.070.856563.312安 徽1953.61.443573.621508.240.575659.213福 建775.80.822410.052295.191.149662.814江 西1103.21.32310.981804.930.664959.915山 东2475.11.443109.111989.530.88095516河 南2815.81.53782.261508.360.582358.517湖 北1296.51.62291

12、.61754.130.879962.818湖 南2089.31.422348.721719.180.58764.719广 东1439.80.883249.612928.241.09659.720广 西1579.91.433090.171590.90.569464.521海 南165.91.354454.771575.490.353565.222四 川3903.71.082870.451340.610.444364.123贵 州1376.61.182282.271206.250.289265.424云 南1642.22.424025.061096.730.345664.225西 藏88.62.5

13、111559.831257.710.434970.426陕 西1046.12.62228.551091.960.438359.727甘 肃6725.862879.361037.120.488357.228青 海137.12.626725.111133.060.409670.329宁 夏139.14.015607.971346.890.497362.530新 疆288.53.967438.131161.711.493957.8第22页,本讲稿共29页因子分析计算步骤与实例分析n第一步 将原始数据标准化n第二步 建立指标间的相关系数阵R:第23页,本讲稿共29页因子分析计算步骤与实例分析n第三步

14、求R的特征值和特征向量。序 号特征值贡献率累积贡献率(%)12.776546.275646.275621.740929.016075.291730.711611.861287.152940.43347.224894.377850.23693.948498.326360.10041.6736100第24页,本讲稿共29页因子分析计算步骤与实例分析 由于前三个特征值累积贡献率已达87.15%,所以取前三个特征值所对应的特征向量如下:u1u2u30.1460-0.6242-0.18540.16310.52700.75470.24210.52720.5369-0.54630.01530.2325-0.

15、54550.2317-0.04220.54530.02250.2276第25页,本讲稿共29页因子分析计算步骤与实例分析n第四步 列出因子载荷矩阵表。因子指标a1a2a3X10.2433-0.8236-0.15640.7621X20.27180.69540.63660.9629X30.40350.69570.45290.8520X4-0.91030.02020.19610.8675X5-0.90890.3057-0.03560.9210X60.90860.02960.1920.8634第26页,本讲稿共29页因子分析计算步骤与实例分析n第五步 对因子载荷阵实行方差最大正交旋转,旋转后的矩阵如下

16、:由上表可见,每个因子只对应少数几个指标的因子载荷较大,因此可根据上表对指标进行分类。因子指标F1F2F3X1-0.3793-0.7252-0.3036X2-0.10460.21780.9510X3-0.29570.86980.0890X40.88620.0265-0.2852X50.94990.12060.0645X6-0.89760.2402-0.0009第27页,本讲稿共29页因子分析计算步骤与实例分析n第六步 将六项指标按高载荷分成三类,并结合专业知识给出各因子的命名如下:高载荷指标命 名因子一X4-家庭基本纯收入X5-人均产值X6-增加值占总产值比重产出及效益因子因子二X1-乡村劳动力人口X3-户均生产性固定资产原值人为投入条件因子因子三X2-人均经营耕地面积自然条件因子第28页,本讲稿共29页因子分析计算步骤与实例分析n在第一因子中,X4、X5、X6三项指标有较大的载荷,这些都从产出效益方面描述农业情况的,所以称为产出及效益因子。n在第二个因子中,X1、X3有较大的载荷,这主要是人们对农业的生产工具、人力等的投入,所以称为人为投入条件因子。n在第三个因子中,X2有较大的载荷,这主要从自然条件方面刻划农业的生产条件状况,所以称为自然条件因子。第29页,本讲稿共29页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁