清华大学 杨虎 应用数理统计课后习题参考答案3.pdf

上传人:蓝**** 文档编号:90991732 上传时间:2023-05-19 格式:PDF 页数:18 大小:705.41KB
返回 下载 相关 举报
清华大学 杨虎 应用数理统计课后习题参考答案3.pdf_第1页
第1页 / 共18页
清华大学 杨虎 应用数理统计课后习题参考答案3.pdf_第2页
第2页 / 共18页
点击查看更多>>
资源描述

《清华大学 杨虎 应用数理统计课后习题参考答案3.pdf》由会员分享,可在线阅读,更多相关《清华大学 杨虎 应用数理统计课后习题参考答案3.pdf(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、习题五习题五1 1某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:kg)日期124910重量 5500580057405710 5440568052405600 5400541054305400 5640570056605700 5610570056105400试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05)解解根据问题,因素A表示日期,试验指标为钢锭重量,水平为5.2假设样本观测值yij(j 1,2,3,4)来源于正态总体Yi N(i,),i 1,2,.,5.检验的问题:H0:12L 5,计算结果:H1:i不全相等.表5.1单因素方差分析表方差来源因素A误差*.自

2、由度415平方和227680216175均方5692014412F值3.9496P值0.02199*=0.01,注释:当=0.001表示非常显著,标记为*,类似地,0.05,分别标记为*,查表F0.95(4,15)3.06,因为F 3.9496 F0.95(4,15),或p=0.02199 0.05,所以接受H0,认为在四种不同催化剂下平均得率无显著差异.3 3试验某种钢的冲击值(kg m/cm2),影响该指标的因素有两个,一是含铜量A,另一个是温度 B,不同状态下的实测数据如下:试验温度含铜量0.2%0.4%0.8%20 0 -20 -4010.6 7.0 4.2 4.211.6 11.0

3、6.8 6.314.5 13.3 11.5 8.7试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(=0.05)解解根据问题,这是一个双因素无重复试验的问题,不考虑交互作用.设因素A,B分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12.2假设样本观测值yij(i 1,2,3,j 1,2,3,4)来源于正态总体Yij N(ij,),i 1,2,3,j 1,2,3,4.记i为对应于Ai的主效应;记 j为对应于Bj的主效应;检验的问题:(1)H10:i全部等于零,H11:i不全等于零;(2)H20:j全部等于零,H21:j不全等于零;计算结果:表5.3双因素无重复试验的方差分析表方差来

4、源因素A因素B误差总和自由度23611平方和60.781764.31585.2717130.3692均方30.390821.43860.8786F值34.589624.4006P值0.0005*0.0009*查表F0.95(2,6)5.143,F0.95(3,6)4.757,显然计算值FA,FB分别大于查表值,或p=0.0005,0.0009 均显著小于0.05,所以拒绝H10,H20,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用.4 4下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:日产量机器M1操作工B115,15,1717,17,1715,17,1618,20,22B

5、219,19,1615,15,1518,17,1615,16,17B316,18,2119,22,2218,18,1817,17,17M2M3M4设每个工人在每台机器上的日产量都服从正态分布且方差相同.试检验:(=0.05)1)操作工之间的差异是否显著?2)机器之间的差异是否显著?3)它们的交互作用是否显著?解解根据问题,这是一个双因素等重复(3次)试验的问题,要考虑交互作用.设因素A,B分别表示为机器和操作,试验指标为日产量,水平为12.假设样本观测值yijk(i 1,2,3,j 1,2,3,4)来源于正态总体Yij N(ij,2),i 1,2,3,j 1,2,3,4,k 1,2,3.记i为

6、对应于Ai的主效应;记 j为对应于Bj的主效应;记ij为对应于交互作用AB的主效应;检验的问题:(1)H10:i全部等于零,H11:i不全等于零;(2)H20:j全部等于零,H21:j不全等于零;(3)H30:ij全部等于零,H31:ij不全等于零;计算结果:表5.4双因素无重复试验的方差分析表方差来源因素A因素B相互效应AB误差总和自由度3262435平方和2.75027.16773.541.333144.75均方0.91713.58312.2501.722F值0.53237.88717.1129P值0.66450.00233*0.00192*查表F0.95(3,24)3.01,F0.95(

7、2,24)3.4,F0.95(6,24)2.51,计算值FA 3.01,FB 3.4,FAB 2.51,或pA 0.05,而pB,pAB均显著小于0.05,所以拒绝H20,H30,接受H10,认为操作工之间的差异显著,机器之间的差异不显著,它们之间的交互作用显著.5 5某轴承厂为了提高轴承圈退火的质量,制定因素水平分级如下表所示因素水平 1水平 2上升温度800820保温时间(h)68出炉温度400500试问应选用哪张正交表来安排试验,并写出第三号试验条件;又如果试验结果为试验号硬度合格率1 2 3 4 100 45 85 70试填好正交试验结果分析表并对试验结果进行直观分析和方差分析.解解根

8、据题意,这是一个3因素2水平的试验问题.试验指标为硬度的合格率.应选择正4交表L4(2)来安排试验,随机生成正交试验表如下:表5.5试验案表方表头设计列号1234A11212B22112C31221空列42121硬度合格率(%)100458570由此可见第三号试验条件为:上升温度800、保温时间 6h、出炉温度 500.直观分析需要计算 K 值,计算结果如下:表 5.6计算表表头设计列号1234A11212185115237251225B2211213017022900400C3122117013022900400空列42121115185237251225硬度合格率(%)100458570K

9、=300P=22500Q=24150Kj1Kj 2QjSj2ST2=3250直观分析由计算的 K 值知,因素 A、B、C 的极差分别为 70,40,40,因此主次关系为A B C,B,C 相当.由于试验指标为硬度的合格率,应该是越大越好,所以各确定因素的水平分别是A1,B2,C1,即最佳的水平组合是A1B2C1,即最佳搭配为:上升温度 800、保温时间 8h、出炉温度 400.采用方差分析法,计算得下表:表 5.7方差分析表方差来源ABC误差总和平方和122540040012253250自由度11114均方差12254004001225F 值10.330.33如果显著性检验水平取 0.1,则查

10、表得F0.9(1,1)39.9,显然计算的 F 值FA1,FB FC 0.33均小于查表值,所以认为三个因素对结果影响都显著.6 6某良种繁殖场为了提高水稻产量,制定试验的因素位级表如下:因素品种密度(颗/100m)2施肥量(kg/100m)2位级 1位级 2位级 3窄叶青 8 号南二矮 5 号珍珠矮 11 号4.503.753.000.750.3751.125问应选用哪张正交表安排试验,并写出第 8 号试验的条件;如果 9 组试验结果为(单位:kg/100m):62.925,57.075,51.6,55.05,58.05,56.55,63.225,50.7,54.45,试对该正交试验结果进行

11、直观分析和方差分析.解解该问题属于 3 因素 3 水平的试验问题,试验指标为水稻产量.根据题意应选择正交4表L9(3)来安排试验,随机生成正交表如下:2表 5.8试验安排表表头设计列号123456789A1111222333B2123123123C3123231312实验结果产量(kg/m%)62.92557.07551.655.0558.0556.5563.22550.754.4522由表可知,第8 号试验的条件:品种(A3)珍珠矮11 号,插值密度(B2)3.75 棵/100m,施肥量(C1)0.75kg/100m 纯氨;直观分析需要计算 K 值,计算结果如下:表 5.9计算表表头设计列号

12、123456A1111222B2123123C3123231实验结果产量(kg/m%)62.92557.07551.655.0558.0556.5522789Ki2Ki3Kj133357.260.456.72123565555.2855.5231256.1254.257.6263.22550.754.45K=174.325同上题进行直观分析,得出K 值的大小关系为:K11 K13 K12,K21 K22 K23,K33 K31 K32由直观分析看出:本例较好的水平搭配是:A1B1C3采用方差分析法,计算得下表:表 5.10方差分析表方差来源ABC误差平方和自由度2222均方差F 值1.7596

13、5.8616.66078.7760.87932.9313.33039.3880.02230.83610.084539.388F0.9(2,2)9,所以认为三个因素对结果影响都不显著.7 7在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比 A,吡啶量 B 和反应时间 C 三个因素,它们各取了7 个水平如下:原料配比 A:1.0,1.4,1.8,2.2,2.6,3.0,3.4吡啶量 B:10,13,16,19,22,25,28反应时间 C:0.5,1.0,1.5,2.0,2.5,3.0,3.5试选用合适的均匀设计表安排试验,并写出第 7 号试验的条件;如果 7 组试验的结果(收率)为:0.3

14、3,0.336,0.294,0.476,0.209,0.451,0.482,试对该均匀试验结果进行直观分析并通过回归分析发现可能更好的工艺条件.4解解根据题意选择均匀设计表U7(7)来安排试验,有 3 个因素,根据使用表,实验安排如:表 5.11试验安排表列号12A112B224C33 6收率0.330.336345673456761357251470.2940.4760.2090.4510.482所以 第 7 号实验的条件为:原配料比3.4,吡啶量 28ml,反应时间 3.5h.通过直观分析,最好的实验条件是:原配料比3.4,吡啶量 28ml,反应时间 3.5h.通过回归分析,最合适的实验条

15、件是:原配料比2.6,吡啶量 16ml,反应时间 0.5h.习题六习题六1 1 从某中学高二女生中随机选取8 名,测得其升高、体重如下:1 2 3 4 5 6 78160 159 160 157 169 162 165身高(cm)154 49 46 53 41 49 50 48体重(kg)43在绝对距离下,试用最短距离法和离差平方和法对其进行聚类分析.解解由R软件,用最短距离(左)和差离平方和法(右)对题目进行聚类分析如下图6.1,表6.1和表6.2:最短距离法离差平方和法图6.1 聚类树形图表 6.1聚类附表(最短距离法)步骤123聚类合并组 1114组 2628系数5.00010.0001

16、3.000首次出现的阶段类别组 1010组 2000下一步24745671111735413.00013.00017.00029.000245600035670表6.2聚类附表(离差平方和法)步骤1234567聚类合并组 11451111组 26873254系数2.5009.00017.50026.33344.750106.833257.375首次出现的阶段类别组 10001456组 20000032下一步47656702 2 已知五个变量的距离矩阵为01).30610753096;20402)10220333044;40403)40430432021034试用最短距离法和最长距离法对这些变量

17、进行聚类,并画出聚类图和二分树.解解针对距离矩阵1),采用两种方法计算如下.最短距离法的聚类步骤如下:w1w2w3w4w5036740159036020a)将w2,w3合并为一类,fh61,H1w1,w4,w5,h6,距离矩阵如下0743023060b)w4,w5合并为一类,h7w4,w5,fh7 2H2w1,h6,h7,距离矩阵如下:034030聚类图和树状图如图6.2:c)w1,h6合并为一类,h8w1,h6,fh83,最后fh93,h9h81h623h74532112345图6.2 聚类图(左)与树状图(右)最长距离法与最短距离法类似,步骤如下:a)w2,w3合并为一类,fh61H1w1

18、,w4,w5,h6,距离矩阵如下0746025090b)w4,w5合并为一类,h7w4,w5,fh7 2H2w1,h6,h7,距离矩阵如下:067090聚类图和树状图如图c)w1,h6合并为一类,h8w1,h6,fh86,最后fh99,6.3:h9h81h623h745962112345图6.3 聚类图(左)与树状图(右)(2)针对距离矩阵2)012340234034040最短距离法的聚类步骤如下a)w2,w1合并为一类,fh61H1w3,w4,w5,h6,距离矩阵如下0342043040b)w3,h6合并为一类,h7w3,h6,fh7 2H2w4,w5,h6,h7,聚类矩阵如下:043040

19、c)w4,h7合并为一类,h8w4,h7,fh83,最后h9w8,h7,fh94聚类图和树状图如图6.4:h9h85h73h6214321142345图6.4 聚类图(左)与树状图(右)由于本题数据的特殊性,最长距离法与最短距离法结果相同(略).(3)044440333022010最短距离法的聚类步骤如下a)w4,w5合并为一类,fh61H1w1,w2,w3,h6,距离矩阵如下0444033020b)w3,h6合并为一类,h7w3,h6,fh7 2H2w4,w5,h6,h7,距离矩阵如下:044030c)w4,h7合并为一类,h8w4,h7,fh8 3,最后h9w8,h7,fh9 4,聚类图和

20、树状图如图6.5:h9h823h7h6451432112345图6.5 聚类图(左)与树状图(右)由于本题数据的特殊性,最长距离法与最短距离法结果相同(略).3 3 在一项关于作物对土壤营养的反应的研究中,要测定土壤的总磷量和总氮量(占干物质重的百分比),今对10份土样测得数据如下:土样变量总磷量()总氮量()1 2 3 4 5 6 7 8 9 100.12 0.15 0.36 0.17 0.14 0.06 0.10 0.11 0.110.120.63 1.19 2.30 1.29 0.73 0.52 0.33 0.61 0.470.66在绝对距离下,试用重心法对其进行聚类分析.解解由R软件得

21、到重心法聚类分析的结果如图6.6与表6.3:图6.6 聚类树形图表6.3聚类过程记录表聚类合并步骤12345组 111612组 2810954系数.001.002.005.010.010首次出现的阶段类别组 101020组 200000下一步24678678961117623.027.048.4592.5723478065078904 4 1975 年Dagnelie收集了 11 年的气象数据资料如下表变量年序x1x2x3x4123456789101187.9 19.6 1.0 1661 89.9 15.2 90.1 968153.0 19.7 56.6 1353132.1 17.0 91.0

22、 1293 88.8 18.3 93.7 1153220.9 17.8 106.9 1286117.7 17.8 65.5 1104109.0 18.3 41.8 1574156.1 17.8 57.4 1222181.5 16.8 140.6 902181.4 17.0 74.3 1150其中:x1前一年 11 月 12 日的降水量;x27 月均温;x37 月降雨量;x4月日辐射,试对这四个气象因子进行主成分分析.表6.4 各主成分的重要性:标准差方差贡献率累积贡献率主成分 11.61033490.64829470.6482947主成分 20.98908480.24457220.892866

23、8主成分 30.534077410.071309670.96417649主成分 40.378541990.035823511.00000000解解由R软件分析得到如下表6.4,6.5:表6.5 因子荷载:X1X2X3X4主成分 10.291-0.5060.577-0.571主成分 20.8710.4250.1360.205主成分 30.332-0.742-0.4180.404主成分 4-0.214-0.1110.6880.685由于前两个主成分对应的累积贡献率已经达到89.287,因此选取主成分的数目为2.5 5 对某初中 12 岁的女生进行体检,测量其身高x1、体重x2、胸围x3和坐高x4,

24、共测得 58 个样本,并算得x(x1,x2,x3,x4)的样本协方差为19.9410.5023.56S 6.5919.7120.958.637.973.937.55试进行样本主成分分析.解解首先计算样本的相关系数矩阵:10.484410.32240.887210.70330.59760.31251设相关系数矩阵的特征值和特征向量分别为d和v阵,计算得到000.05460 0 0.312600d=000.96470 0002.6681即四个特征值依次为:2.6681,0.9647,0.3126,0.0546,前两个主成分的累计贡献率为:90.8471%,因此提取主成分为 2.四个特征根相应的特征

25、向量为0.53330.4620 0.06000.7060 0.7317 0.17430.34040.5642v=0.60570.19320.60400.48060.30690.65870.48460.4870因此,两个主成分的表达式为:z1 0.06x10.7317x20.6057x30.3069x4z2 0.706x10.1743x20.1932x30.6587x46 6 比较因子分析和主成分分析模型的异同,阐明两者的关系.解解(1)提取公因子的方法主要有主成分法和公因子法.若采取主成分法,则主成分分析和因子分析基本等价,该法从解释变量的变异的角度出发,尽量使变量的方差能被主成分解释;而公因

26、子法主要从解释变量的相关性角度,尽量使变量的相关程度能被公因子解释,当因子分析目的重在确定结构时则用到该法.(2)主成分分析和因子分析都是在多个原始变量中通过他们之间的内部相关性来获得新的变量,达到既减少分析指标个数,又能概括原始指标主要信息的目的.但他们各有其特点:主成分分析是将 n 个原始变量提取 m 个支配原始变量的公因子,和 1 个特殊因子,各因子之间可以相关或不相关.(3)统用降维的方法,但差异也很明显:主成分分析把方差划分为不同的正交成分,而因子分析则把方差化分为不同的起因因子;因子分析中的特征值的计算只能从相关系数矩阵出发,且必须把主成分划分为因子.(4)因子分析提取的公因子比主

27、成分分析提取的主成分更具有可解释性.(5)两者分析的实质及重点不同.主成分的数学模型为Y AX,因子分析的数学模型为X AF.因而可知主成分分析是实际上是线性变换,无假设检验,而因子分析是统计模型,某些因子模型是可以得到假设检验的;主成分分析主要综合原始数据的信息,而因子分析重在解释原始变量之间的关系.(6)SPSS 数据的实现:两者都通过“analyze data reductionFactor”过程实现,但主成分分析主要使用“descriptires”,“extraction”,“stores”对话框,而因子分析处使用这些外,还可使用“rotaction”对话框进行因子旋转.7 7 试对第

28、 4 题的变量作因子分析,并将结果和上面的结果进行比较.解解用SPSS分析,计算结果如下表6.6-6.8:表6.6反应压缩比情况表前一年11月12日的降水量当年7月均温当年7月降雨量月日辐射提取方法:主成分法初始值1.0001.0001.0001.000提取值.219.665.864.845计算的相关系数矩阵的特征值和方差贡献率:初始特征根方差百分主成分1234提取方法:主成分法总计2.593.978.285.143比%64.82924.4577.1313.582累积百分比%64.82989.28796.418100.000总计2.593表6.7方差解释度提取因子的方差解释度方差百分比%64.

29、829累积百分比%64.829表6.8主成分矩阵主成分前一年11月12日的降水量当年7月均温当年7月降雨量月日辐射1-.468.815-.930.9198 8 为研究某一树种的叶片形态,选取50 片叶测量其长度x1(mm)和宽度x2(mm),按样本数据求得其平均值和协方差矩阵为:x1134,x2 92,9048S 4845求出相关系数阵R,并由R出发作因子分析;解解1)求相关系数矩阵:0.730390481S,R 489010.73032)用R软件求R的特征根及其相应的特征向量,软件输出结果如下:$values1 2.99393809 0.07273809$vectors ,1 ,21,0.7

30、071068-0.70710682,0.7071068 0.70710681 2.9939,2 0.0727,T1T(0.7071,0.7071),2(-0.7071,0.7071)3)求载荷矩阵A:1.22350.1907A 1.22350.19074)0.9881h121.5333,h221.5333,A*0.988120.154 0.154u11,u21,v1 0.3043,v20.3043,222i2i2A0ui 2,B0vi 0,C0(u v)0.9074,D0 2uivi 0i1i1i1i19 9 1981 年,生物学家Grogan和Wirth对两种蠓虫Af和Apf根据其触角长度x

31、1和翼长x2进行了分类,分类的数据资料如下:Af12345678 x11.241.361.381.381.381.401.481.54x21.271.741.641.821.901.701.821.82Apf123456x11.141.181.201.261.281.30 x21.781.961.862.002.001.96(1)试建立Af和Apf的Fisher判别模型;(2)对样本(1.24,1.80),(1.28,1.84),(1.40,2.04)进行判别分类.解解(1)建立Fisher判别模型1919TT1(x1i,x2i)(1.42,1.75),2(y1i,y2i)T(1.23,1.9

32、3)T9i19i10.08480.149 0.01980.0218A1,A 20.1490.39120.02180.0390.0080.013A1 A2n n 20.0130.03312120.19,0.18,T1T121.325,1.8421 345.05135.42,带入Fisher判别函数135.4283.33 345.05135.42T(x1,x2)(1.325,1.84)0.19,0.18135.4283.33 91.3017x141.3369x244.534(2)把三个样本(1.24,1.80),(1.28,1.84),(1.4,2.04)带入模型,得到结果:三个样本均属于 Apf

33、 类.1010 在两个玉米品种之间进行判别:137 玉米G1和甜玉米G2,选取的两个变量是:x1玉米果穗长;x2玉米果穗直径,两个类的样本容量为n1n240,实际算得两个类的样本均值和样本协方差为:18.56x1,5.9825.34x2,4.128.1204.458S1,4.4584.3509.6613.720S23.7203.410试建立G1,G2的Bayes类线性判别函数.解解因为已知两类的样本均值和样本协方差为:x1(18.56,5.98)T,x2(25.34,4.12)T,8.1204.4589.6613.720S1,S 24.4584.3503.7203.410可计算得到修正的公共协方差矩阵和逆矩阵0.2280.145A1 A2 5.6393.731,n n 20.1450.0998.25147.38121T1221.95,5.0521带入Fisher判别函数Wx(x(12)T1(12)2126.78,1.86,T 5.6393.73T(x1,x2)21.95,5.056.78,1.868.25147.38 74.3x196.95x21141.29

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 研究报告 > 其他报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁