《因子分析数学模型.ppt》由会员分享,可在线阅读,更多相关《因子分析数学模型.ppt(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、因子分析因子分析数学模型计算步骤及实例因子旋转因子得分R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示因子分析的数学模型因子分析的数学模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表
2、示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示因子分析的数学模型因子分析的数学模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用
3、矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示因子分析的数学模型因子分析的数学
4、模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析
5、R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示因子分析的数学模型因子分析的数学模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型
6、因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型用矩阵表示R型因子分析 Q型因子分析R型因子分析的数学模型简记为且满足 为任一个m 阶的正交阵,上式仍满足约束条件因子分析每个相
7、应的系数不是唯一的,即因子载荷阵不是唯一的。通过模型 以F 代替X,由于mp,从而达到简化变量维数目的。因子分析的目的因子分析的目的正交因子模型中各统计量的意义正交因子模型中各统计量的意义因子载荷的统计意义因子载荷的统计意义因子载荷aij 的统计意义是第i 个变量与第j 个公共因子的相关系数。用统计学术语叫权重,表示Xi 依赖Fj 的份量(比重)。因子载荷阵A中第i行元素的平方和,即称为变量Xi 的共同度。共同度。共同度。共同度。为了说明它的统计学意义,对为了说明它的统计学意义,对XiXi的表达式两边求方差,即的表达式两边求方差,即公共因子方差公共因子方差剩余方差剩余方差变量共同度的统计意义因
8、子载荷阵A中各列元素的平方和记为表示第j 个公共因子对所有分量的总影响,称为第j 个公共因子对X 的贡献,它是衡量第j 个因子相对重要性的指标公共因子Fj方差的统计意义因子载荷阵的估计方法主成分法主成分法 主因子法主因子法 极大似然法极大似然法设样本的协差阵的特征值和对应的标准正交化特征向量分别为:则协差阵可分解为当最后p-m个特征值较小时,协差阵可以近似的分解为A即为因子协方差阵。即为因子协方差阵。当X的协方差阵未知,可以用样本协方差阵S去代替。因子旋转因子旋转不管用何种方法确定因子载荷矩阵A,它们都不是唯一的,我们可以由任意一组初始公共因子做线性组合,得到新的一组公共因子,使得新的公共因子
9、彼此之间相互独立,同时也能很好的解释原始变量之间的相关关系。这样的线性组合可以找到无数组,这样就引出了因子旋转。因子旋转的目的是为了找到意义更为明确,实际意义更明显的公因子。因子旋转不改变变量共同度,只改变公因子的方差贡献。因子旋转分为两种:正交旋转和斜交旋转特点:正交旋转:由因子载荷矩阵A左乘一正交阵而得到,经过旋转后的新的公因子仍然保持彼此独立的性质。正交变化主要包括方差最大旋转法、四次最大正交旋转、平均正交旋转。斜交旋转:放弃了因子之间彼此独立这个限制,可达到更简洁的形式,实际意义也更容易解释。不论是正交旋转还是斜交旋转,都应该在因子旋转后,使每个因子上的载荷尽可能拉开距离,一部分趋近1
10、,一部分趋近0,使各个因子的实际意义能更清楚地表现出来。方差最大化正交旋转方差最大化正交旋转假设前提假设前提:公因子的解释能力能够以其因子载荷平方的方差来度量先考虑两个因子的平面正交旋转:对A按行计算共同度,考虑到各个变量的共同度之间的差异所造成的不平衡,需对A中的元素进行规格化处理,即每行的元素用每行的共同度除之。规格化后的矩阵,为方便仍记为A,施行方差最大正交旋转(C为正交阵):假设前提假设前提:公因子的解释能力能够以其因子载荷平方的方差来度量先考虑两个因子的平面正交旋转:对A按行计算共同度,考虑到各个变量的共同度之间的差异所造成的不平衡,需对A中的元素进行规格化处理,即每行的元素用每行的
11、共同度除之。规格化后的矩阵,为方便仍记为A,施行方差最大正交旋转(C为正交阵):假设前提假设前提:公因子的解释能力能够以其因子载荷平方的方差来度量先考虑两个因子的平面正交旋转:对A按行计算共同度,考虑到各个变量的共同度之间的差异所造成的不平衡,需对A中的元素进行规格化处理,即每行的元素用每行的共同度除之。规格化后的矩阵,为方便仍记为A,施行方差最大正交旋转(C为正交阵):假设前提假设前提:公因子的解释能力能够以其因子载荷平方的方差来度量先考虑两个因子的平面正交旋转:对A按行计算共同度,考虑到各个变量的共同度之间的差异所造成的不平衡,需对A中的元素进行规格化处理,即每行的元素用每行的共同度除之。
12、规格化后的矩阵,为方便仍记为A,施行方差最大正交旋转(C为正交阵):假设前提假设前提:公因子的解释能力能够以其因子载荷平方的方差来度量先考虑两个因子的平面正交旋转:对A按行计算共同度,考虑到各个变量的共同度之间的差异所造成的不平衡,需对A中的元素进行规格化处理,即每行的元素用每行的共同度除之。规格化后的矩阵,为方便仍记为A,施行方差最大正交旋转(C为正交阵):目的:希望所得结果能使载荷矩阵的每一列元素的绝对值尽可能向1和0两极分化,即原始变量中一部分主要与第一因子有关,另一部分主要与第二因子有关,也就是要求(b112,bp12),(b122,bp22)这两组的方差尽量大。为此,正交旋转的角度必
13、须满足使旋转后得到因子载荷阵的总方差V1+V2=G达到最大。经过计算,其旋转角度可按下面公式求得:推广到多个公共因子的情况推广到多个公共因子的情况如果公共因子多于两个,我们可以逐次对每两个进行上述的旋转,设公共因子数m21.第一轮旋转,每次取两个,全部配对旋转,变换共需进行m(m-1)/2次2.对第一轮旋转所得结果用上述方法继续进行旋转,得到第二轮旋转结果。每一次旋转后,矩阵各列平方的相对方差之和总会比上一次有所增加。3.当总方差的改变不大时,就可以停止旋转。因子得分因子得分因子分析的数学模型是将变量表示为公共因子的线性组合。由于公共因子能反映原始变量的相关关系,用公共因子代表原始变量时,有时
14、更有利于描述研究对象的特征,因而往往需要反过来将公共因子表示成为变量的线性组合,即称上式为因子得分函数。估计因子得分函数的方法估计因子得分函数的方法加权最小二乘法回归法 回归法是1939年由Thomson提出来的,所以又称为汤姆森回归法。Thomson假设公共因子可以对p个变量做回归,由于假设变量及公共因子都已经标准化了,所以常数项为0.即回归方程为:则,我们有如下的方程组:我们现在仅知道由样本值可得因子载荷阵A,由因子载荷的意义知:j=1,2,m于是F=BX,就是估计因子得分的计算公式。,记为B.在估计出公因子得分后,可以利用因子得分进行进一步的分析,如样本点之间的比较分析,对样本点的聚类分
15、析等,当因子数m较少时,还可以方便地把各样本点在图上表示出来,直观地描述样本的分布情况,从而便于把研究工作引向深入。因子分析的步骤因子分析的步骤 计算所选原始变量的相关系数矩阵计算所选原始变量的相关系数矩阵 相关系数矩阵描述了原始变量之间的相关关系。可以帮助判断原始变量之间是否存在相关关系,这对因子分析是非常重要的,因为如果所选变量之间无关系,做因子分析是不恰当的。并且相关系数矩阵是估计因子结构的基础。选择分析的变量选择分析的变量用定性分析和定量分析的方法选择变量,因子分析的前提条件是观测变量间有较强的相关性,因为如果变量之间无相关性或相关性较小的话,他们不会有共享因子,所以原始变量间应该有较
16、强的相关性。提取公共因子提取公共因子 这一步要确定因子求解的方法和因子的个数。需要根据研究者的设计方案或有关的经验或知识事先确定。因子个数的确定可以根据因子方差的大小。只取方差大于1(或特征值大于1)的那些因子,因为方差小于1的因子其贡献可能很小;按照因子的累计方差贡献率来确定,一般认为要达到60才能符合要求。因子旋转因子旋转 通过坐标变换使每个原始变量在尽可能少的因子之间有密切的关系,这样因子解的实际意义更容易解释,并为每个潜在因子赋予有实际意义的名字。计算因子得分计算因子得分 求出各样本的因子得分,有了因子得分值,则可以在许多分析中使用这些因子,例如以因子的得分做聚类分析的变量,做回归分析
17、中的回归因子。因子分析计算步骤与实例分析因子分析计算步骤与实例分析 对我国30个省市自治区的农业生产情况作因子分析。从农业生产条件和生产结果及效益出发,选取六项指标分别为:X1乡村劳动力人口(万人)、X2人均经营耕地面积(亩)、X3户均生产性固定资产原值(元)、X4家庭基本纯收入(元)、X5人均农业总产值(千元/人)、X6增加值占总产值比重(%)原始资料数据如下页表:序号序号地地 区区X1X2X3X4X5X61北 京66.90.932972.413290.732.52549.72天 津80.21.644803.542871.621.77449.63河 北1621.82.034803.54287
18、1.810.8004544山 西635.42.762257.661499.140.55556.25内蒙古514.110.175834.941550.150.905166.46辽 宁605.12.963108.862059.351.475253.17吉 林534.24.734767.511940.461.115463.18黑龙江494.88.245573.022075.421.628357.89上 海661.021660.034571.813.044835.610江 苏1530.21.262826.862868.331.192150.611浙 江1123.10.945494.233289.070
19、.856563.312安 徽1953.61.443573.621508.240.575659.213福 建775.80.822410.052295.191.149662.814江 西1103.21.32310.981804.930.664959.915山 东2475.11.443109.111989.530.88095516河 南2815.81.53782.261508.360.582358.517湖 北1296.51.62291.61754.130.879962.818湖 南2089.31.422348.721719.180.58764.719广 东1439.80.883249.612928
20、.241.09659.720广 西1579.91.433090.171590.90.569464.521海 南165.91.354454.771575.490.353565.222四 川3903.71.082870.451340.610.444364.123贵 州1376.61.182282.271206.250.289265.424云 南1642.22.424025.061096.730.345664.225西 藏88.62.5111559.831257.710.434970.426陕 西1046.12.62228.551091.960.438359.727甘 肃6725.862879.36
21、1037.120.488357.228青 海137.12.626725.111133.060.409670.329宁 夏139.14.015607.971346.890.497362.530新 疆288.53.967438.131161.711.493957.8第一步第一步 将原始数据标准化将原始数据标准化第二步第二步 建立指标间的相关系数阵建立指标间的相关系数阵R:第三步第三步 求求R的特征值和特征向量的特征值和特征向量。序 号特征值贡献率累积贡献率(%)12.776546.275646.275621.740929.016075.291730.711611.861287.152940.433
22、47.224894.377850.23693.948498.326360.10041.6736100 由于前三个特征值累积贡献率已达87.15%,所以取前三个特征值所对应的特征向量如下:u1u2u30.1460-0.6242-0.18540.16310.52700.75470.24210.52720.5369-0.54630.01530.2325-0.54550.2317-0.04220.54530.02250.2276 第四步第四步 列出因子载荷矩阵表列出因子载荷矩阵表。因子指标a1a2a3X10.2433-0.8236-0.15640.7621X20.27180.69540.63660.9
23、629X30.40350.69570.45290.8520X4-0.91030.02020.19610.8675X5-0.90890.3057-0.03560.9210X60.90860.02960.1920.8634 第五步第五步 对因子载荷阵实行方差最大正交旋转,旋对因子载荷阵实行方差最大正交旋转,旋转后的矩阵如下转后的矩阵如下:由上表可见,每个因子只对应少数几个指标的因子载荷较大,因此可根据上表对指标进行分类。因子指标F1F2F3X1-0.3793-0.7252-0.3036X2-0.10460.21780.9510X3-0.29570.86980.0890X40.88620.0265-
24、0.2852X50.94990.12060.0645X6-0.89760.2402-0.0009第六步第六步 将六项指标按高载荷分成三类,并结合专业将六项指标按高载荷分成三类,并结合专业知识给出各因子的命名知识给出各因子的命名在第一因子中,X4、X5、X6三项指标有较大的载荷,这些都从产出效益方面描述农业情况的,所以称为产出及效益因子。在第二个因子中,X1、X3有较大的载荷,这主要是人们对农业的生产工具、人力等的投入,所以称为人为投入条件因子。在第三个因子中,X2有较大的载荷,这主要从自然条件方面刻划农业的生产条件状况,所以称为自然条件因子。高载荷指标命 名因子一X4-家庭基本纯收入X5-人均产值X6-增加值占总产值比重产出及效益因子因子二X1-乡村劳动力人口X3-户均生产性固定资产原值人为投入条件因子因子三X2-人均经营耕地面积自然条件因子 参考文献:参考文献:1.于秀林、任雪松:多远统计分析。中国统计出版社。2.李卫东:应用多远统计分析。北京大学出版社。谢谢谢谢!