《第11讲因子分析(2)优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第11讲因子分析(2)优秀PPT.ppt(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第11讲因子分析讲因子分析(2)2022/12/5西南科技大学生命科学与工程学院周海廷制作1现在学习的是第1页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作24.4用FACTOR过程实现因子分析例例4.14.1某医学院测得某医学院测得2020例肝病患者的项肝功能例肝病患者的项肝功能指标指标SGPT(SGPT(转氨酶转氨酶)、肝大指数、肝大指数、ZnT(ZnT(硫酸锌硫酸锌浊度浊度)和和AFP(AFP(胎甲球胎甲球),依次用,依次用X X1 1至至X X4 4表示,表示,试试进行因子分析。进行因子分析。现在学习的是第2页,共33页2022/12/5西南科技大学生命科学与工
2、程学院周海廷制作3现在学习的是第3页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作4程序的第部分写了个过程步,每个过程步中程序的第部分写了个过程步,每个过程步中都含有个重要的选择,即都含有个重要的选择,即 提取初始公因子的主要方法(即在选择项提取初始公因子的主要方法(即在选择项METHOD=或或M=后填个选择项)后填个选择项)PRINCIPAL主成分分析法主成分分析法PRINIT 迭代主因子分析法迭代主因子分析法ML 最大似然法最大似然法给各变量的公因子方差给各变量的公因子方差h2i赋初值赋初值(即在即在PRIORS后填个选择项,中括号内为后填个选择项,中括号内为缩写形式
3、缩写形式)现在学习的是第4页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作5通常在用主成分分析法时,才让通常在用主成分分析法时,才让PRIORS=ONE。PRIORS=后其他选择项及其含义如下:后其他选择项及其含义如下:ASMCA 置置h2i正比于正比于xi与其他指标与其他指标之间的全相关系数的平均之间的全相关系数的平均;MAXM置置h2i为为xi与其他指标中某与其他指标中某一个的最大绝对相关系数一个的最大绝对相关系数;ONEO置所有的置所有的h2i;RANDOMR 置置h2i为在与之间服从为在与之间服从均匀的伪随机数均匀的伪随机数;SMCS置置h2i为为xi与其他指标之
4、间全与其他指标之间全相关系数的平均。相关系数的平均。现在学习的是第5页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作6注意:上述个选择项通常是配套发挥作用的,注意:上述个选择项通常是配套发挥作用的,如:当如:当M=PRINPRIORS=ONE时则指定用时则指定用主成分主成分分析法;分析法;若若MPRINPRIORS其他内容时则指定用无其他内容时则指定用无迭代的迭代的主因子主因子分析法;分析法;当当MPRINIT,无论,无论PRIORS=什么,则指定用什么,则指定用迭代的主因子迭代的主因子分析法;分析法;当当M=ML,无论,无论PRIORS=什么,则指定用什么,则指定用最大
5、最大似然法似然法。M=后还可写其他一些方法后还可写其他一些方法(从略从略)。现在学习的是第6页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作7规定因子轴的规定因子轴的旋转法旋转法(即在选择项即在选择项ROTATE=或或R=后填个选择项后填个选择项)VARIMAXV最大方差旋转法最大方差旋转法;ORTHOMAX正交最大方差旋转法正交最大方差旋转法;PROMAX在正交最大方差旋转基础在正交最大方差旋转基础上进行上进行斜交旋转斜交旋转。SCORE表示要求算出因子得分模型中的系数。表示要求算出因子得分模型中的系数。另外,用户还可事先在过程步语句中增加选另外,用户还可事先在过程步语
6、句中增加选择项择项NFACTOR=n,要求保留,要求保留n个公因子个公因子,否则否则,只只保留特征值大于的那些公因子。保留特征值大于的那些公因子。现在学习的是第7页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作8由以上的解释可知:本程序的个过程分别用主由以上的解释可知:本程序的个过程分别用主成分分析法、无迭代主因子分析法、有迭代主成分分析法、无迭代主因子分析法、有迭代主因子分析法、最大似然法提取初始因子,都用因子分析法、最大似然法提取初始因子,都用最大方差旋转法旋转、并求出得分因子模型。最大方差旋转法旋转、并求出得分因子模型。现在学习的是第8页,共33页2022/12/5
7、西南科技大学生命科学与工程学院周海廷制作9输出结果及其解释输出结果及其解释这是用这是用主成分主成分分析法提取初始公因子的第部分分析法提取初始公因子的第部分结果,相关矩阵的特征值总和为结果,相关矩阵的特征值总和为4(指标数指标数),前,前个特征值个特征值1.718252和和1.093536都大于都大于,下面将下面将根据这个较大的特征值提取个相应的初始根据这个较大的特征值提取个相应的初始公因子。公因子。现在学习的是第9页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作10 含有个公因子的初始公因子模型为含有个公因子的初始公因子模型为:x1=0.91753F1+0.09935F2
8、x2=0.90420F1-0.29662F2 x3=0.11527F1+0.94550F2x4=0.21337F1+0.31893F2现在学习的是第10页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作11第和第公因子能解释的方差分别为第和第公因子能解释的方差分别为1.718252和和1.093536。个标准化变量最后的共性估计。个标准化变量最后的共性估计值之和为值之和为2.811787,与与x1,x2,x3,x4相对应相对应的共性估计值依次为:的共性估计值依次为:0.851727,0.905562,0.907256,0.147242。现在学习的是第11页,共33页2022
9、/12/5西南科技大学生命科学与工程学院周海廷制作12现在学习的是第12页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作13经最大方差旋转法旋转后的因子模型为经最大方差旋转法旋转后的因子模型为:x1=0.87226G1+0.30149G2 x2=0.94758G1-0.08748G2x3=-0.09851G1+0.94739G2 x4=0.13687G1+0.35848G2旋转后的第和第公因子能解释的方差旋转后的第和第公因子能解释的方差分别为分别为1.687177和和1.124611;个标准化指标共;个标准化指标共性之和以及它们各自的共性估计值与旋转前相性之和以及它们各自
10、的共性估计值与旋转前相同。同。现在学习的是第13页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作14因子得分模型为因子得分模型为:G1=0.50027x1+0.57347x2-0.12744x3+0.05600 x4 G2=0.20766x1-0.14705x2+0.85781x3+0.31200 x4现在学习的是第14页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作15下面分别是由第个过程步产生的最后部下面分别是由第个过程步产生的最后部分结果,即因子得分模型。分结果,即因子得分模型。现在学习的是第15页,共33页2022/12/5西南科技大学生命科
11、学与工程学院周海廷制作16现在学习的是第16页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作17下面仅根据第个过程步给出的完整结果,对公因子下面仅根据第个过程步给出的完整结果,对公因子进行命名,并加以应用。进行命名,并加以应用。从旋转后的因子模型看,第公因子从旋转后的因子模型看,第公因子G1基本上基本上支配着支配着x1和和x2;第公因子;第公因子G2基本上支配着基本上支配着x3。这揭。这揭示示(以专业知识为依据以专业知识为依据):第公因子反映肝脏慢性炎症,可简称为第公因子反映肝脏慢性炎症,可简称为慢性炎症因慢性炎症因子子。第公因子反映肝脏急性炎症,可简称为第公因子反映肝脏
12、急性炎症,可简称为急性炎症因急性炎症因子子;现在学习的是第17页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作18设现有一肝病病人的项肝功能指标测量值为设现有一肝病病人的项肝功能指标测量值为:X1=50、X2=2.0、X3=31、X4=45 把它们分别代入用原指标表达的公因子得分模型,求得把它们分别代入用原指标表达的公因子得分模型,求得:G1=-0.922464,G2=1.824968该病人在反映慢性炎症的第公因子上的得分明显大于反映急该病人在反映慢性炎症的第公因子上的得分明显大于反映急性炎症的第公因子上的得分,故可诊断该病人很可能为肝脏慢性性炎症的第公因子上的得分,故可
13、诊断该病人很可能为肝脏慢性炎症患者。炎症患者。将标准化变量将标准化变量xj还原成原变量还原成原变量Xj,得到用原指标表达的,得到用原指标表达的公因子得分模型公因子得分模型:G1=0.005628X1+0.543702X2-0.017176X3+0.002560X4-1.874012G2=0.002336X1-0.139417X2+0.115612X3+0.014260X4-2.238670现在学习的是第18页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作19例2以10名游泳选手为受试者,观测了气力、耐力、速度与协调性四项指标,观察值如下表。试分析这四项体能的共同因素。选选
14、手手气气力力耐力耐力速度速度协调协调11197429811133911544813151456561162699757488121145915121113101646现在学习的是第19页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作20【SAS 程程序序】OPTIONS NODATE PS=40 LS=80 NONUMBER;DATA FACTOR;INPUT SUBJECT$A B C D;资料资料集定集定义义LABEL A=气气力力B=耐力耐力C=速度速度D=协调协调;CARDS;现在学习的是第20页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作
15、21PROC FACTOR DATA=FACTOR OUTSTAT=FACTOUT OUT=FOUMETHOD=P PRIORS=SMC ROTATE=V NFACTOR=2因因子子分析分析(主主轴轴法法)SIMPLE CORR SCORE;VAR A B C D;PROC PRINT DATA=FACTOUT;打打印因印因子子分析的分析的统计输出统计输出PROC PRINT DATA=FOUT;打打印因印因子子分分数数的的资料输出资料输出RUN;现在学习的是第21页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作22结果输出结果输出(1)平均数、标准差、及相关矩阵Mean
16、sandStandardDeviationsfrom10observationsABCDMean7.88.87.68.7StdDev4.391911762.820559443.777124133.88873016现在学习的是第22页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作23Correlations(相关性)ABCD A1.000000.740880.262560.10019气力B0.740881.000000.460980.12561耐力C0.262560.460981.000000.80034速度D0.100190.125610.800341.00000协调由上
17、表得知气力和耐力之间有高度正相关,而速度与协调之间也呈现高度正相关。现在学习的是第23页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作24(2)抽取共同因子:主主轴轴法法(PRINCIPAL FACTOR METHOD)(未未转轴转轴)估估计计共同性的方法:共同性的方法:复复相相关关平方估平方估计计法法(SMC)Initial Factor Method:Principal Factors PriorCommunalityEstimates:SMC(共同性估共同性估计值计值)ABCD0.5802350.7087010.7883210.730745Eigenvaluesof
18、theReducedCorrelationMatrix:Total=2.80800128Average=0.70200032现在学习的是第24页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作251234特征值Eigenvalue1.98051.0174-0.0170-0.1730Difference0.96311.03440.1560Proportion0.70530.3623-0.0060-0.0616Cumulative0.70531.06761.06161.0000现在学习的是第25页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作262 fac
19、torswillberetainedbytheNFACTORcriterion.FACTOR1FACTOR2A0.579810.53587气力B0.708220.52027耐力C0.84291-0.35551速度D0.65746-0.57724协调因子組型(未转轴)FactorPattern现在学习的是第26页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作27解释量VarianceexplainedbyeachfactorFACTOR1FACTOR21.9805061.017435InitialFactorMethod:PrincipalFactors共同性FinalCo
20、mmunalityEstimates:Total=2.997940ABCD0.6233410.7722620.836882 0.765455现在学习的是第27页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作28由以上由以上报报表所知,第一因子表所知,第一因子解释解释性性较较第二因子強,第二因子強,且未且未转轴转轴時,以時,以 C(C(速度速度)因子共通性較強,因子共通性較強,解解释释83.69 83.69。而由相。而由相关关矩矩阵阵得知,得知,A A、B B具有具有高度正相高度正相关关,C C、D D 也具有高度正相也具有高度正相关关。我們。我們大致可大致可区区分成分成A
21、 A、B B一一类类,C C、D D一一类类,即,即气气力和力和耐力、速度和耐力、速度和协调协调分分类类。现在学习的是第28页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作29(3)转转 轴轴 法法:正 交转 轴法(最 大变 异法,VARIMAXROTATION)RotationMethod:Varimax转换矩阵OrthogonalTransformationMatrix1210.743460.668782-0.668780.74346现在学习的是第29页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作30因素組型(已转轴)RotatedFactor
22、PatternFACTOR1FACTOR2 A0.072680.78617气力B0.178580.86045耐力C0.864430.29942速度D0.874840.01055协调现在学习的是第30页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作31解释量VarianceexplainedbyeachfactorFACTOR1FACTOR21.5497501.448190共同性FinalCommunalityEstimates:Total=2.997940ABCD0.6233410.7722620.8368820.765455经过转轴后,A、B、C、D之共同性依然不变。现
23、在学习的是第31页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作32(4)因子分数系数ScoringCoefficientsEstimatedbyRegressionSquaredMultipleCorrelationsoftheVariableswitheachFactorFACTOR1FACTOR20.8556880.799598RotationMethod:VarimaxStandardizedScoringCoefficients(标准化后之因子得分)FACTOR1FACTOR2 A-0.033860.33497气力B-0.124520.61762耐力C0.599
24、000.02021速度D0.41447-0.11677协调现在学习的是第32页,共33页2022/12/5西南科技大学生命科学与工程学院周海廷制作33经过转轴后经过转轴后,将将因子因子与与因子之差因子之差异异拉拉开开,可明,可明显区显区分成分成气气力力与与耐力、速度耐力、速度与协调与协调二二类类。【结论结论】由以上由以上报报表我表我们们可得知,可得知,对于影响对于影响游泳游泳选选手的因手的因子子气气力、耐力、速度、力、耐力、速度、协调协调,经过转轴后经过转轴后,可,可将将气气力、耐力力、耐力归为归为一一类类,将将其命名其命名为为体体能因能因子子;而;而速度、速度、协调协调可可将将其其归为归为技巧因技巧因子子,所以,所以影响选影响选手手测验测验成成绩绩我們可大致知道有二我們可大致知道有二类类共同因素。共同因素。现在学习的是第33页,共33页