《(本科)统计学全书课后习题参考答案(2-9)全.pdf》由会员分享,可在线阅读,更多相关《(本科)统计学全书课后习题参考答案(2-9)全.pdf(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章1、提名频数班长30学习委员15团支部书16体育委员7生活委员12频数班长学习委员 团支部书 体育委员 生活委员众数2、众数3中位数3均值2.6 3 3 3 3 3极差5内距1标准差3、1.1 8 8 5 4 6 8 7 7众数6 8 2.8 2中位数6 8 2.8标准差0.0 5 1 8 4 3均值6 8 2.7 9 1 7内距0.0 6极差0.1 9宣方图汇率 Stem-and-Leaf PlotFrequencyStem&Leaf1.006826.83.006827.0027.006827.67788999.006828.0122233343.006828.557Stem widt
2、h:.10Each leaf:1 case(s)682.90-682.85-682.80-682.75-682.70-682.65-汇率4、(1)均值 72124.65标 准 差 134804.51.82方差 x 1O10(2)制造业1.16表制造业05年对外直接投资额高于05年各行业对外直接投资额平均值1.16个标准差。建筑业-0.47表建筑业05年对外直接投资额低于05年各行业对外直接投资额平均值1.16个标准差(3)偏度系数SK 2.304027峰度系数K 5.504099由于SK0,数据分布为正偏或右偏。K0数据位尖峰分布。5、(1)平均 63.83333中位数 67.5众数 71因该
3、组数据存在极端值,应采取中位数或众数来测量集中趋势。(2)异众比率83.3%内距14.75标 准 差10.33268方差 106.7644(3)北京Z值-1.05表2006年北京市的年平均相对湿度低于全国主要城市平均水平-1.05个标准差贵 阳1.47表2006年贵阳市的年平均相对湿度高于全国主要城市平均水平1.47个标准差(4)偏度系数-0.74044峰度系数0.384825(5)80.00-70.00-60.00-50.00-40.00-30.00-年*均6、均值 33.41176中位数32.5众 数32.5方差 58.48329标 准 差7.647437偏度-0.12101不对称50-M
4、ean=33.41Std.Dev.=7.647N=17040-Aouonbalu.1O-0J-j10.0020.0030.0040.0050.0060.00VAR000017、11 月中位数均值标准差方差离散系数偏度系数峰度系数5.996.0633330.1490750.0222230.0245860.756676-0.7491212月中位数5.985平均 5.98标准差 0.137598方差 0.018933离散系数 0.02301偏度系数 0.013753峰度系数-0.8441第三章(1)C-i-P9-(1-P)n-10-P3 4 3 2 4 8 41 3 3 1 3 3 2 0 0 2
5、0 0 三,I(4)0.15,0.5(5)77.2%,3.1%1 ,C%p 5 q 5,(J i。(/。+C f0+C l。+C f0+C?o+C瑞)玛2 o o/c;8 o o o+禺0 0禺5 0 0/玛8()0 0 0.2231,0.2510,0.5578(9)0.0166(10)9000(11)675.67,299.85(12)0.379,4.781,0.431(13)0.004902,0.990196,0第四章1、4 5.9 2(2)已知 n=3 6,当 a 为 0.1,0.0 5,0.0 1 时,相应的Z o.%=L 6 4 5,Z o.o 5/=L 9 6,Z o.o i/=2.
6、5 8O/2/2根据样本数据计算得:元=4 5.9 2,s=5.9 1由于题目已知服从正态分布,所以全体工人平均日加工产品数的9 0%的置信区间为:S5 91J Za/赤1 5.9 2 1.6 4 5 x:即(4 4.2 5,4 7.5 8)。同理,全体工人平均加工产品数的9 5%、9 9%的置信区间分别为(4 3.9 2,4 7.9 1),(4 3.2 4,4 8.6 0)。(3)1 9/3 6=0.5 3(4)日加工产品数超过4 5件的工人比例的9 0%的置信区间为:p ZJ -5 3 -4 7=0.5 3 0.1 3 6 8 3 6,即(0.3 9 3,0.6 6 7).(5)3 3.9
7、 1(6)已知 s=5.9 1,n=3 6,a =0.1,由 e x c e l 的 C H I I N V”函数计算的(3 6-1)=4 9.8 0,若一o i/(3 6-1)=4 6.3 5/2 /2总 体 方 差 的 置 信 区 间 为 止 萼 与 更,即 坐 空 工2工力电,一也 4 9 8 035X5.91246.359 5%、9 9%的置信区间同理可求.2、2.05(2)已知 n=2 0,当a 为 0.1,0.05,0.01 时,相应的Zo.%=1.645,ZO.O5/2=1.96,ZO.OI/2=2.58O根据样本数据计算得:1=2.05,s=L23由于题目已知服从正态分布,所以
8、,成年人平均每天喝矿泉水瓶数90%的置信区间为:05 1.645 x-=-,即(1.57,2.53)O同理,95%,99%的置信区间分别为(1.47,2.63),(1.26,2.84)0(3)14/20=0.7(4)成年人中每天喝2瓶及2瓶以上矿泉水的人所占比例的90%的置信区间为:(5)1.2344(6)已知 s=1.23,n=20,a=0.1,由 excel 的“CHIINV”函数计算的力/(20-1)=30.14,z5_0 1/(20-1)=10.12 /2./2总 体 方 差 的 置 信 区 间 为 止 曾 W b 左 纥 芷,即 誓 义 工 2工力吆 力 419X1.23210.12
9、95%、99%的置信区间同理可求.3、(175.8055,251.3820)4、(2 9.8 1 8 8,3 8.5 3 1 2)5、(0.5 8 9 7,0.7 1 2 3)6、(0.2 3 6 0,0.4 2 0 0)7、(4 8 9 8 3 6.2 2 2 7,1 2 8 8 0 4 4.9 8)8、(0.0 0 0 3,0.0 0 1 6)9、(-1 0 6.8 6 8,-1.2 4 3)(0.2 2,1.2 6)1 0、(-2.5 4 7,-0.4 3 3)(0.1 2 8,1.5 1 2)1 1、(-0.2 5 7,-0.0 0 3)1 2、(0.1 0 8,0.3 0 8)1 3
10、、(-0.2 0 8,1.6 2 5)1 4、1 0 71 5、1 0 6 7第五章1、Ho:|i 3 0,山:V 3 0Z 3 1 4 5这是一个左侧检验 P-v al u e=P Z a=O.O 5,故不能拒绝原假设。2 Ho:|i 4Z =x,”3.2a/V n这是一个右侧检验 P-v al u e=P Z 3.2=0.00069由于a=o.O 5,由于 P-v al u e=0.00069 a=0.05,则拒绝原假设3、统计量z为-1.4 9 070.025的分位数为1.9 6P 值 0.136所以不拒绝原假设4、统计量1.5 8 11P 值 0.1138不能拒绝原假设5、Z 统计量-
11、6.78 74P 值 1.14 14 x 10-11拒绝原假设6、Z统计量17.5 4拒绝原假设7、不能认为程序A所花时间显著地长于程序B,只能说明方差不相等。8、上下分位数2.100,0.4 76F统计量0.4 65P 值 0.04 33拒绝原假设9、(1)上下分位数-2.68 2,2.68 2T统计量1.05 9 3P 值 0.2947不能拒绝原假设(2)F 统计量 1.2216上下分位数0.3371,2.9667P 值 0.6278不能拒绝原假设10、支持11、方差检验F统计量0.4444上下分位数0.4078,2.3452P 值 0.0754均值检验T统计量-2.2385上下分位数-2
12、.0167,2.0167P 值 0.0304存在差距12、方差检验F统计量0.8760上下分位数0.5675,1.7622P 值 0.6449均 值 检 验T统计量1.4502上下分位数-1.9845,1.9845P 值 0.1502不存在差异13、P值0.1 0 5 1,不能拒绝原假设,没有显著提高14、F 统计量 1.2913上下分位数0.3851,2.8098P 值 0.5829不能拒绝原假设15、F 统计量 1.7409上下分位数0.3851,2.分98P 值 0.1585不能拒绝原假设第六章1、对该列联表进行百分比化的结果为:软件难易程度软件1软件2软件3软件4合计低5/32=15.
13、6%10/32=31.3%14/32=43.8%3/32=9.3%100%(3:中8/61=13.1%28/61=45.9%18/61=29.5%7/61=11.5%100%(6高22/57=38.6%7/57=12.3%8/57=14.0%20/57=35.1%100%(5,合计35/150=23.3%45/150=30.0%40/150=26.7%30/150=20.0%100%(1:2、解:设立统计假设如下:H 0:软件的难易程度与软件的类别无关H a:软件的难易程度与软件的类别有关检 验 统 计 量 为 片=喜 r9卡方值的求解过程如下表所示:软件难易程度实际频数f 1 J期望频数e
14、ij(e ij-fij)2/e ij1低5(35*32)/150=7.470.811中8(35*61)/150=14.232.731高22(35*57)/150=13.35.692低10(45*32)/150=9.60.022中28(45*61)/150=18.35.142高7(45*57)/150=17.15.97由上表可以看出,所以单元格的期望频数均不低于5,因此可以进行3低14(40*32)/150=8.533.503中18(40*61)/150=16.270.183高8(40*57)/150=15.23.414低3(30*32)/150=6.41.814中7(30*61)/150=12
15、.22.224高20(30*57)/150=11.46.49合计15015037.97卡方检验。由上表可知,卡方的值为37.97,在0.05的显著性水平下,临界值为-.12.59 o由于37.9712.59,因此在0.05的显著性水平下拒绝原假设,即认为软件的难易程度与软件的类别有关。1、对列联表进行百分比化后的结果为:生活满意度小城市中等城市大城市合计低48.74%18.49%32.77%100%中18.95%28.10%52.94%100%高10.16%66.41%23.44%100%合计25.00%37.50%37.50%100%2、解:设立统计假设如下:H 0:生活满意度与城市的大小无
16、关H a:生活满意度与城市的大小有关检验统计量为-气%()计算过程如下所示城市规模生活满意度实际频数fij期望频数eij(e ij-fij)2/e ij小城市低5829.7526.83小城市中2938.252.24小城市高1332.0011.28中等城市低2244.6311.47中等城市中4357.383.60中等城市高8548.0028.52大城市低3944.630.71大城市中8157.389.73大城市高3048.006.75合计400400.00101.12经计算,卡方统计量的值为101.12,在0.05的显著性水平下,临界值为9.49。由于统计量的值远远大于临界值,因此在0.05的显
17、著性水平下拒绝原假设,即认为生活满意度与城市的规模有关。3、关于定类数据之间关联度的测试我们采用克莱姆统计量,其计算公式为:-底,由于列联表的行数和列数均为3,m=2,样本量n=400。经计算,V=0.3556。可见,虽然生活满意度与城市的规模有关,不过这个关联程度不是很高。三、由于出勤率是数值型变量,而工作日是分类变量,在研究分类变量对数值型变量的影响时,我们通常采用方差分析的方法。设立统计假设如下:H 0:出勤率与工作日无关H a:出勤率与工作日有关检验统计量为F输出的统计结果如下表所示:差异源 SS df MS F P-value Fcrit组间 9.4291.046667 0.3186
18、2 0.964086 2.124029组内131.4 403.285总计 140.82 49由有P值远大于显著性水平0.05,所以我们不能拒绝原假设,即不能认为出勤率与工作日有关。四、方差来源SSDfMSF自变量1.4220.71001.36误差10.93210.5205总和12.35230.5370提出假设 HO:ui=uj Ha:ui*uj;构造检验统计量F(k-l,n-k),在本题中F(2,21)=2.57统计决策:由于1.362.57,故不能拒绝原假设,即不能认为自变量对应变量的影响显著。五、方差来源SSDFMSF行变量2282.35456.462.1443列变量1448.84362.
19、21.7015误差4257.420212.87总和7988.529275.4655行变量的临界值为F0.01(5,20)=4.1列变量的临界值为F0.01(4,20)=4.43因为行,列变量的F值均小于临界值,所以认为它们对因变量的影响不显著。八、方差来源SSDFMSF行变量52.6226.30000.1150列变量24.838.26670.3659交互150.7625.11670.1204误差108.9363.0250总和337.0477.1702查表可得,临界值分别为3.32,2.84,2.34统计量F的值都小于临界值,因此我们认为不能拒绝原假设,即不能认为行变量,列变量,交互作用等对因变
20、量的影响显著。七、建立假设检验:H o:四台机器灌装的蜂蜜均值相等U产U2=U3=U4H a:四台机器灌装的蜂蜜均值不完全相等;构建统计量F,其参考的临界值为F0.01(3,18)=5.08进行方差分析,得到的结果如下表所示:差异源 SS df MS F P-value Fcrit组间 7,318182 5 1.463636 0.22959 0.944059 2.852409组内 102 16 6.375总计 109.3182 21因为F=2.85小 于 临 界 值 5.0 8,所以我们不能拒绝原假设,即不能认为四台机器灌装的平均重量有差异。八、应当采用方差分析的方法,本题要考察的是对三位厨师
21、的认可程度是否存在差别,认可程度是数值性变量,而不同的厨师可以认为是分类变量,所以要采用方差分析的方法。分析的结果如下表所示:因为P=0.000436 F1 13160 13160 48.19 0.00018 2 1 s,74852 273.093579 15345Root MSE 16.52554Dependent Ucon 74.90000Coeff Var 22.063480.85760.8398VariableStdnddrdE rror t Value Pr !t lIntercept2.346150.7751511.685320.111660.84590.00011、估 计 的 回
22、 归 方 程 为 y=2.3 4 6 1 5+0.7 7 5 1 5 x;2、估计的标准误差 S e=(M S E)-5=(2 7 3.0 9 3 5 7)0 5=1 6.5 2 5 5 4;3、斜率估计的标准差为0.1 1 1 6 6;4、判定系数R 2=0.8 5 7 6;5、由于P 值很小,接近于零,故可认为X对 Y的影响显著。Rl4ualt ft f二、由残差序列图如下所示:6、从图上可以看出,残差随着自变量的变化在变化,我们可以认为它存在着一定的异方差问题。但是由于数据量太少,这种特征并不明显,我们需要加大样本量来进一步考察这个问题。三、经济学理论上认为,收入对消费有决定作用,所以我
23、们构建的方程自变量X为收入,因变量Y为消费,方程形式如下:Y=B0+BiX+ETlie REG ProcedureNode I:MOOEIJDcpnndeot V a ria b le:yNumber o f Observations Read 13Number o f Observat ions Used 19Analysis o f VarianceSun o f HeanSource DF Squares Square F Value Pr FHodol I 194311948 194311948 916.36 11|In tercep t I 1148.41053 207.39117
24、5.54.0001x I 0.80553 0.02661 30.27.00011、估计的回归方程为:y=1148.41053+0.80553x;2、估计的标准误差为Se=460.48552;3、斜率的标准差为0.02661;4、判定系数R2=0.9818;5、由于P值很小,接近于零,故认为自变量对因变量的影响显著;Durbin-Watson D 0.171Pr DU DN 1.0000Number of Observations 191st Order Autocorrelat ion 0.8176、由上述DW结果可看出,序列存在正的自相关性。四、建立回归方程Y=B()+B|X+B2X+E,做
25、分析,得到如下结果:Parameter Estim atesParameterV aria b le DF Estim ateStandardE rro r t ValueIn tercep txlx2103.150040.7855921.0644318.12412 5.69 0.00010.28044 2.80 0.01605.61550 3.75 0.0028Var ianceIn fla tio n01.143161.14316SourceModelE rro rC orrected TotalMeanSquare F Value Pr F2 2939.70552 1469.852761
26、2 1051.22781 87.6023214 3990.9333316.78 0.0003Root MSEDependent MeanC oeff Var9.35961200.733334.GG271R-Squareftdj R-Sq0.73660.69271、回归方程的A d j R2=0.6 9 2 7,自变量大约解释了因变量总变差的7 0%;整体的拟合优度还不错;2、方程的F统计量为1 6.7 8,从P值可看出整体效果显著;3、系数的P值也都小于显著性水平0.0 5,所以X 1.X 2的系数显著。五、根据第四题的回归分析结果Uar ianceIn fla tio n01 .143161
27、.143161、从方差膨胀因子V IF可以看出,自变量之间不存在严重的多重共线性的问题;2、残差图如下:从残差图的结果来看,Y的残差随着X i,X 2 的增长而增大,故我们认为存在着异方差的问题。六、我 们 欲 了 解 消 费 的 决 定 因 素,故 构 建 回 归 方 程Y=B()+B|X|+B|X 2+E,其 中 Y代表月消费支出,XX分别代表月收入和储蓄存款余额,在 S A S 中实现的结果如下所示:The REG ProcedureModel:MODEL 1Dependent V aria b le:yNumber o f Observat ions ReadNumber o f Ob
28、scrvat ions UsedAnalysis of VarianceSourceSue o fSquaresMeanSquareF ValueMode IErrorCorrected TotalDF35401206131782904857949617700603280389 It l0.12674分别代表商品零售价格指数,工业品出厂价格指数,原材料、燃料、动力购进价格指数,固定资产价格指数。用SAS软件进行分析,得出以下结果:Analysis of Var ianceSourceSum ofSquaresMeanSquareF ValueModelErrorCorrected Total4
29、13805.663895.88722811.55111201.415970.45286444.76|t|StandardE rro rt ValuePr|t|War ianceIn fla t ionIn tercep t1-1.785753.65577-0.4 90.63342.14494-0.8 30.42010 xl11.026260.109569.37.00010.103299.94Square DF Ch iSq-ftu to co rrelat Ions 6121824532.14680.73694.06699.346.000112.000118.000124.00010.9660
30、.60?0.1860.0810.9310.5280.1470.0770.8790.4520.1230.0780.8250.3730.1040.07B0.7540.3030.0900.0760.6770.2400.0810.0752、该序列有长期趋势,进行一阶差分前后得到的结果分别为:差分前:差分后:从图中可以明显地看出,经过差分后,长期趋势被去除了。从自相关图来看的话,自相关拖尾被趋向于零,可以认为差分后的序列基本实现了平稳。3、从图形来看,该序列不存在季节性的因素,所以无需做进一步的差分。4、综合考虑,我们选择的模型是ARIMA(1,1,1),进行预测的结果如下表所示:ObsForecast
31、Std Error95%Conf idence Lim its1202858.4423267.86682333.43303383.45161212842.9627360.31482136.75873549.16661222865.7798444.41001994.75233736.80741232861.3065508.19091865.27063857.3423124287G.2805569.12721760.81163991.74941252877.3962621.32891659.61404095.17841262888.3874671.32741572.60994204.1649127
32、2892.3413716.61291487.80594296.87671282901.3100760.03391411.67094390.94921292906.7051800.54181337.67214475.73821302914.6468839.47891269.29854559.99521312920.7738876.42721203.00824638.53951322928.1940912.05841140.59244715.79551332934.6926946.22611080.12354789.26171342941.8479979.28691022.48084861.215
33、12010-12月的指数预测值为2858.4423,95%的置信区间为(2333.4330,3383.4516)。第四题:经计算得到如下结果:LagCovar ianceC o rre la t ion-19 8 7 6 5 4 3 2 1 0 1 2 3 4 E)6 7 8 9 1Std E rro r05.85283E121.000001 ;*|011 .81294E120.30975ii.*I0.25819924.3 3 4 3E110.07405ii*10.2818863-1.4867E12-.25401ii*|i0.2831804-8.6782E11-.14827i1 *0.2979
34、835-2.6356E12-.450311i*i0.3028626-1.9544E12-.33392ii*i0.3446197-8.5 9 1 1E11-.146791i*i0.36555481.21766E120.208051*I0.36946397.92558E110.13541ii;*i0.377192103.92691E110.0670911*10.380419第九章1、该数据适合采用主成分分析,原因有以下两点:(1)、解释变量较多;(2)、从相关系数矩阵来看的话,X 与 Y 之间的相关性较高,可以通过主成分的方法实现降维。相关系数矩阵如下图所示:X y Nx1.0000 0.9867
35、 0.1871y 0.9867 1.0000 0.1930z 0.1871 0.1930 1.00002、按照相关系数矩阵进行分析,得到的结果如下图所示,从图中我们可以看出第3 个主成分对整体方差的影响很小,应当从模型中剔除,所以应当取前两个主成分。C o rro la t ion M atr ixVzP r in iP rin 2Pr in31.00000.98670.18710.9818-.1 7 1 50.0814V0.98671.00000.19300.9828-.1 6 5 4-.0 8 1 50.18710.1 9 301.00000.3 5 380.9 3 530.0 0 05P
36、 rin l0.98180.98280.35381.00000.00000.0000Pr in2-.1 7 1 5-.1 6 5 40.93530.00001.00000.0000Pr in30.0814-.0 8 1 50.0 0 050.00000.0 0 001.0000E ig en va1ues o f the C o rre la t ion M atr ixE ig en valu e D i ffe re n c e P ro p o r11on C um ulative1 3.05515699 1.12358321 0.5 0 92 0.50922 1.93157378 0.
37、91830456 0.3 2 19 0.83113 1.01326922 1.01326922 0.1 6 89 1.00004 0.00000000 0.00000000 0.0 0 00 1.00005 0.00000000 0.00000000 0.0 0 00 1.00006 0.00000000 0.0 0 00 1.00003、该主成分分析的总体结果还是不错的,前两个主成分解释了总方差的83.11%,我们认为达到了降维的目的,并且尽可能多地保留了原来的信息,从而很好地解决了多重共线性的问题。1、该数据适合采用主成分分析,原因有以下两点:1.00000.82890.74070.108
38、/0.60580.58170.27540.69180.50710.80990.8289 0.7407I.0000 0.80690.8069 I.00000.2821 0.47640.6274 0.71480.7287 0.79130.5700 0.54490.8165 0.85420.5673 0.62090.8138 0.6819C orrelatio n M atrixX4XSX6X7X8X9XI00.10870.60S80.58170.27S40.69180.S0710.80990.28210.62740.72870.57000.81650.56730.81380.47640.71480
39、.79130.54490.85420.62090.68191.00000.30/40.34410.Z07S0.42720.29850.15900.30741.00000.47050.18100.74510.44600.62350.34410.47051.00000.64160.82440.69040.62190.70750.18100.64161.00000.53130.39560.33840.42720.74510.82440.53131.00000.53620.70090.29850.44600.69040.39560.53621.00000.59640.15900.62350.62190
40、.33840.70090.S9641.0000(1)、涉及到的自变量太多,维度太高,分析的难度加大,准确性降低;(2)、从上表可以看出,自变量之间存在着相关性,这就为通过主成分分析实现降维提供了可能性。2、相关的分析结果如下所示:|Procomofl|从图上的结果来看的话,提 取3个主成分比较合适,前六个主成分大概解释了总方差的80%以上,第3个以后每个主成分对总方差的贡献有限,若将它们加入到模型中来,会增大模型的复杂程度,降低可靠性。3、主成分分析的结果如下表所示:The PR INCOMP ProcedureP rin i P rin 2XI0.322771-.342896X20.3638
41、74-.111652X30.3695260.023465X40.1877120.639026X50.294479-.210533X60.3427130.107868X70.2500150.568124X80.365846-.001528X90.2863870.003458X100.330290-.286903E igenvectorsPr in3Pr in4Pr in5Pr in6-.020289一.2869280.292707-.544591-.076792-.3500440.0941520.0783010.13G4480.050247-.163950-.5146510.3813990.12
42、57900.376172-.1219450.6308010.316101-.0760430.274421-.3573700.066031-.5490970.039531-.209809一.3466410.0645570.2041890.187533一.056473-.4279840.151992-.4624690.7311100.256118-.046970-.104494-.1210020.4205330.523147P rln7Pr in8P rln9P rinlO0.0832630.3414830.433477-.042424-.4981650.121519-.5182640.42446
43、80.023445-.668581-.250164-.1996990.3176500.174535-.1086320.309161-.361536-.0684760.3817040.0945700.260023-.0317190.3039100.524203-.347464-.1201670.361886-.3722290.24S0770.489220-.301788-.48067G-.1964500.168184-.090899-.1631770.475122-.321563-.027527-.051018(1)、在对 XI,即废气治理设施数的解释上,Pl,P5,P7,P8,P9的影响是正的
44、,其余是负的。对X I的影响力度上,P6,P9为最大的负影响因素,Pl,P 8为最大的正影响因素。针对其他的变量,参考对X I的分析。、P1 =0.322771 X 1+0.363874X2+0.369526X3+0.187712X4+0.294479X5+0.342713X6+0.250015X7+0.365846X8+0.286387X9+0.330290X10P2P 1 0依次类推。4、三、1、因子载荷的含义是:因子载荷aij的统计意义就是第i个变量与第J个公共因子的相关系数即表示X i依赖F j的份量(比重)。统计学术语称作权,心理学家将它叫做载荷,即表示第i个变量在第j个公共因子上的
45、负荷,它反映了第i个变量在第J个公共因子上的相对重要性。在因子分析中,通常只选其中m个(m 0.656432832.168.22.80.99513-1.047542915.129.915.90.626791.033013022.944.715.9-0.022660.97474四、1、该数据适合采用因子分析的方法,原因有以下几点:(1)、自变量有多个,而且从数据初步观察可以看出,经常账户数额较大的通常金融账户的数额也大,我们认为两者之间可能存在某种相关性,故存在降维的可能性;(2)、自变量全部为国际收支盈余的测量指标,我们认为它们之间有共同的影响因素,故可以为因子分析的结果提供合适的解释。2、应
46、当提取两个公因子,如果只提取一个,损失的信息量太大,提取两个累积贡献率已经能达到94%以上。Eigenvalue Di fference Proport ion Cumulat ive1 I.834209G9 0.82052265 0.6114 0.61142 1.01368704 0.86158376 0.3379 0.94933 0.15210327 0.0507 1.00002 factors will be reta ined by the PROPORT ION cr i ter ion.3、由下表可以得出,X=0.52604FI+0.10317F2Y=0.01608FI+0.983
47、25F2Z=-0.51922FI+0.08776F2Standardized Scoring CoefficientsFactor!Factor2X X 0.52604 0.10317y y 0.01608 0.98325z z-0.51922 0.087764、将各个国家的数据代入,计算各个国家的因子得分,结果如下所示:XyzF a c to r1Factor24261.130.50159.11 .56GG41.269868.67.007.40.14775-0.046476.13.50-2 0.60.15755-0.200071G.011.1099.50.109980.138481566.3
48、-5 4.7 0-1726.21.45760-2.7438769.8-0.4 012.60.16128-0.3G161-6 3.5-0.4 0-5 0 8.90.35987-0.41204289.3-0.3 0-1 0 8.50.29425-0.35198-8 3.01.80100.10.06882-0.2700063.00.2030.20.15109-0.33475391.1-2.6 0-1 8 3.90.36329-0.45041-1 4.72.700.10.14006-0.234414.10.0230.20.13055-0.34653-2 0 9.80.30125.30.01200-0.
49、34142113.042.80-1 2 8.60.273051.49656-6 7 32.8-2 6.0 05368.4-4.72769-1.5049875.91 .40-1 3 1.50.23230-0.29486-2 8 3.010.90319.0-0.096790.12694-5 0.51 .4036.70.10956-0.29010-1 2 5.84.20169.10.02330-0.16374-3 2.310.304 9.20.116290.09665-529.110.001426.1-0.702340.1S917-7 8 0.333.50815.3-0.486091.1089465
50、3.9-2 3.2 0-3 3 5.00.51072-1.33 4 55-1 8 6.047.70398.3-0.074401.72974-2 4 6.48.90256.8-0.056330.038081023.35.00-1392.51.15500-0.17499-1453.662.901340.0-0.944892.37502-1 2 9.30.1095.20.05388-0.34698-7 8 7.752.60651.1-0.398091.92061-5 7 6.816.30207.8-0.142590.33145-1 0 6.4-5.6 0145.00.03441-0.58774?国加