《应用数理统计课后习题参考答案.pdf》由会员分享,可在线阅读,更多相关《应用数理统计课后习题参考答案.pdf(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、习题五1某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:日期重(单位:kg)旦 量57401249550054405400564056105800568054105700570057105600524054305400570056605610105400试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05)2解根据问题,因素A表示日期,试验指标为钢锭重量,水平为 5.假设样本观测值yj(j 123,4)来源于正态总体YN(i,检验的问题:H。:i 2L计算结果:表5.1方差来源因素A误差自由度平方和单因素方差分析表均方5),i1,2,.,5,Hi:i不全相等.F值3.9496P值
2、0.02199*4152276802161755692014412*类似地,注释:当=0.001表示非常显著,标记为=0.01,0.05,分别标记为查表F0.95(4,15)3.06,因为F 3.9496F0.95(4,15),或p=0.02199 0.05,所以接受H。,认为在四种不同催化剂下平均得率无显著差异3 试验某种钢的冲击值(kg Xm/cm2),影响该指标的因素有两个,一是含铜量一个是温度 B,不同状态下的实测数据如下:试验温度含铜量A,另20 C10.611.614.50C7.011.013.3-20C4.26.811.5-40C4.26.38.70.2%0.4%0.8%试检验含
3、铜量和试验温度是否会对钢的冲击值产生显著差异?(解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用=0.05)设因素A,B分别表示为含铜量和温度,试验指标为钢的冲击力,水平为假设样本观测值yj(i 1,2,3,j 1,2,3,4)来源于正态总体YjN(j,12.2),i 1,2,3,j 1,2,3,4.记i为对应于A的主效应;记j为对应于Bj的主效应;检验的问题:(1)Hi。:i全部等于零,Hi i不全等于零;(2)H20:j全部等于零,H21:j不全等于零;计算结果:表5.3双因素无重复试验的方差分析表方差来源因素A因素B误差总和自由度平方和均方F值34.589624.4006P值
4、0.0005*0.0009*236ii60.781764.31585.271730.390821.43860.8786130.3692查表F0.95(2,6)5.143,局.95(3,6)4.757,显然计算值FA,FB分别大于查表值,或p=0.0005,0.0009 均显著小于 0.05,所以拒绝Hi,H20,认为含铜量和试验温度 都会对钢的冲击值产生显著影响作用.4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:日产量操作工机器B115,15,1717,17,1715,17,1618,20,22B219,19,1615,15,1518,17,1615,16,17B16,18,
5、2119,22,2218,18,1817,17,17M1M2M3M4设每个工人在每台机器上的日产量都服从正态分布且方差相同1)2)3)解操作工之间的差异是否显著?机器之间的差异是否显著?它们的交互作用是否显著?试检验:(=0.05)根据问题,这是一个双因素等重复(3 次)试验的问题,要考虑交互作用12.设因素A,B分别表示为机器和操作,试验指标为日产量,水平为假设样本观测值yjk(i1,2,3,j 1,2,3,4)来源于正态总体2YjN(ij,j为对应于),i1,2,3,j 1,2,3,4,k 1,2,3.记i为对应于A的主效应;记Bj的主效应;记j为对应于交互作用A B的主效应;(1)H10
6、:i全部等于零,(2)H20:j全部等于零,(3)H30:j全部等于零,检验的冋题:H11:i不全等于零;H21:j不全等于零;H31:ijj不全等于零;计算结果:表5.4双因素无重复试验的方差分析表方差来源因素A因素B相互效应AXB误差总和自由度平方和均方F值0.53237.88717.1129P值0.66450.00233*0.00192*32624352.75027.16773.541.3330.91713.58312.2501.722144.75查表FO.95(3,24)3.01,FO.95(2,24)3.4,F0.95(6,24)2.51,计算值FA 3.01,FB 3.4,FA B
7、 2.51,或pA 0.05,而pB,pA B均显著小于 0.05,所以拒绝H20,H30,接受 He,认为操作工之间的差异显著,机器之间的差异不显著,它们之间的交互作用显著.5 某轴承厂为了提高轴承圈退火的质量,制定因素水平分级如下表所示因素水平1试验号硬度合格率水平2上升温度c保温时间(h)岀炉温度c80082068400500试问应选用哪张正交表来安排试验,并写出第三号试验条件;又如果试验结果为1100245385470试填好正交试验结果分析表并对试验结果进行直观分析和方差分析解根据题意,这是一个 3 因素 2 水平的试验问题.试验指标为硬度的合格率应选择正交表L4(24)来安排试验,随
8、机生成正交试验表如下:表5.5试验案表方表头设计列号A11212B22112C31221空列硬度合格率(%421211004585701234由此可见第三号试验条件为:上升温度直观分析需要计算 K 值,计算结果如下:800C、保温时间 6h、出炉温度 500C.表5.6计算表表头设计列号A11212185115B22112130170C31221170130空列硬度合格率(%421211151852372512251234100458570K=300P=22500Q=24150c 2ST=3250Kji5Qj2372512252290040022900400S.2j直观分析 由计算的 K 值知
9、,因素 A、B、C 的极差分别为 70,40,40,因此主次关系 为A B C,B,C 相当.由于试验指标为硬度的合格率,应该是越大越好,所以各确定 因素的水平分别是A,B2,CI,即最佳的水平组合是AB2C1,即最佳搭配为:上升温度 800C、保温时间 8h、出炉温度 400C.采用方差分析法,计算得下表:表5.7方差分析表自由度方差来源平方和均方差F值10.330.33ABC误差总和1225400400122532501111412254004001225如果显著性检验水平取0.1,则查表得F.9(1,1)39.9,显然计算的 F 值FA1,FBFC0.33均小于查表值,所以认为三个因素对
10、结果影响都显著密度(颗/100m)26 某良种繁殖场为了提高水稻产量,制定试验的因素位级表如下:因素位级1位级2位级3品种窄叶青8号南二矮5号珍珠矮11号施肥量(kg/100m2)4.503.753.000.750.3751.125问应选用哪张正交表安排试验,并写出第8 号试验的条件;如果 9 组试验结果为(单位:kg/100m):62.925,57.075,51.6,55.05,58.05,56.55,63.225,50.7,54.45,试对该 正交试验结果进行直观分析和方差分析.解 该问题属于 3 因素 3 水平的试验问题,试验指标为水稻产量.根据题意应选择正交 表Lg(34)来安排试验,
11、随机生成正交表如下:表5.8试验安排表表头设计列号A1111222333B2123123123C3123231312实验结果产量(kg/m2%1234567862.92557.07551.655.0558.0556.5563.22550.754.459由表可知,第 8 号试验的条件:品种(A3)珍珠矮 11 号,插值密度(B2)3.75 棵/100m2施肥量(C1)0.75kg/100m 纯氨;直观分析需要计算 K 值,计算结果如下:表5.9计算表表头设计列号A111122233B2123123123C3123231312实验结果产量(kg/m2%12345678962.92557.07551
12、.655.0558.0556.5563.22550.754.45357.2Ki2565555.2855.5256.1254.260.456.72K=174.325Ki357.62同上题进行直观分析,得出K 值的大小关系为:K23,K33K31K32Ku K13K12,K21K22由直观分析看出:本例较好的水平搭配是:采用方差分析法,计算得下表:AB1C3表5.10方差分析表方差来源平方和自由度均方差F值ABC误差1.75965.8616.66078.77622220.87932.9313.33039.3880.02230.83610.084539.388FO.9(2,2)9,所以认为三个因素对
13、结果影响都不显著7 在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比间 C 三个因素,它们各取了 7 个水平如下:原料配比A:1.0,A,吡啶量 B 和反应时1.8,2.2,2.6,3.0,3.4吡啶量B:10,13,16,1922,25,28反应时间C:0.5,试选用合适的均匀设计表安排试验,并写出第,1.5,2.0,2.5,3.0,3.5,7 号试验的条件;如果 7 组试验的结果(收率)为:0.33,0.336,0.294,0.476,0.209,0.451,0.482,试对该均匀试验结果进行直观 分析并通过回归分析发现可能更好的工艺条件解 根据题意选择均匀设计表U7(74)来安排试
14、验,有 3 个因素,根据使用表,实验安排如:表5.11试验安排表A列号B224613C336251收率1123412340.330.3360.2940.4760.20955676757470.4510.482所以第 7 号实验的条件为:原配料比 3.4,吡啶量 28ml,反应时间 3.5h.通过直观分析,最好的实验条件是:原配料比通过回归分析,最合适的实验条件是:原配料比3.4,吡啶量 28ml,反应时间 3.5h.2.6,吡啶量 16ml,反应时间 0.5h.习题六1 从某中学高二女生中随机选取8 名,测得其升高、体重如下:316018身高(cm)体重(kg)2159415751696162
15、71654816015449434653414950在绝对距离下,试用最短距离法和离差平方和法对其进行聚类分析解 由 R 软件,用最短距离(左)和差离平方和法(右)对题目进行聚类分析如下图 6.1,表 6.1 和表 6.2:最短距离法图6.1聚类树形图离差平方和法表6.1聚类附表(最短距离法)步骤聚类合并组1组2系数首次岀现的阶段类别组1组2下一步123451141116287355.00010.00013.00013.00013.00017.0000102450000002475676|7I1429.000630 1聚类附表(离差表6.2平F方和法)步骤聚类合并系数首次岀现的阶段类别下一步组
16、1组2组1组21162.5000042489.00000735717.50000641326.33310551244.750406615106.833537714257.3756202 已知五个变量的距离矩阵为036740 1234044440159023403331).036;2)034;3)022020401000试用最短距离法和最长距离法对这些变量进行聚类,并画出聚类图和二分树 解针对距离矩阵 1),采用两种方法计算如下最短距离法的聚类步骤如下:Wiw W3W4W5036740 1590360 20a)将W2,W3合并为一类,f h61,H1W-!,W4,W5,hs,距离矩阵如下074
17、30 2 30 60b)W4,W5合并为一类,h7W4,W5,f h72H2W-I,hs,h7,距离矩阵如下:c)wi,hs合并为一类,hsw,hs,f hs3,最后fh93,聚类图和树状图如图6.2:h9h8h71h6412345X2 31图6.2聚类图(左)与树状图最长距离法与最短距离法类似,步骤如下:a)W2,W3合并为一类,f h6HiWi,W4,W5,h6,距离矩阵如下1W4,W5,fb)W4,W5合并为一类,h7距离矩阵如下:Wi,h3,hy,H2c)Wi,h6合并为一类,h86.3:h7最后fhg9,聚类图和树状图如图h996_21h8h7/34512h6512图6.3聚类图(左
18、)与树状图(右)(2)针对距离矩阵2)0 1 20 23434034040最短距离法的聚类步骤如下a)W2,w合并为一类,f h61HiW3,W4,23400,距离矩阵如下W5,%0 3 40 4b)w3,h6合并为一类,gW3,h6,fh7H2wt,W5,h6,h7,聚类矩阵如下:合并为一4类,聚类图和树状图如图 6.4:112c)w,hzh8W4,hz,f hg3,最后hgW3,hz,f hg 4h9Z4321111 _ 1 _341521图6.4聚类图(左)与树状图(右)由于本题数据的特殊性,最长距离法与最短距离法结果相同(略)0 4 4 4 40 3 3 30 2 20 10最短距离法
19、的聚类步骤如下a)ww 合并为一类,f h61HiW|,w2,w3,he,距离矩阵如下0 4 440 330 20b)W3,h6合并为一类,h?W3,h6,f h?2H2 w4,w5,h6,h7,距离矩阵如下:0 4 40 30c)wt,h7合并为一类,h8w4,h7,f hs3,最后h9w8,h?,f h94,聚类图和树状图如图 6.5:4nI3卜-21-1,_|r-L-1234图6.5聚类图(左)与树状图(右)由于本题数据的特殊性,最长距离法与最短距离法结果相同(略).3 在一项关于作物对土壤营养的反应的研究中,要测定土壤的总磷量和总氮量(占干物质重的百分比),今对 10 份土样测得数据如
20、下:总氮量()0.120.630.661.192.301.290.730.520.330.610.47在绝对距离下,试用重心法对其进行聚类分析解由 R 软件得到重心法聚类分析的结果如图6.6 与表 6.3:0图6.6聚类树形图表6.3聚类合并组1组2聚类过程记录表首次岀现的阶段类别组1组2步骤系数下一步123456781161261118109547623.001.002.005.010.010.027.048.4592.57201020347800000065024678789094 1975 年Dagnelie收集了 11 年的气象数据资料如下表123456789101187.989.91
21、53.0132.188.8220.9117.7109.0156.1181.5181.419.615.219.717.018.317.817.818.317.816.817.01.090.156.691.093.7106.965.541.857.4140.674.3166196813531293115312861104157412229021150其中:X1前一年 11 月 12 日的降水量;X2 7 月均温;X3 7 月降雨量;X4月日辐射,试 对这四个气象因子进行主成分分析解 由 R 软件分析得到如下表 6.4,6.5:表6.4各主成分的重要性主成分1标准差方差贡献率累积贡献率主成分2主成分
22、3主成分41.61033490.64829470.64829470.98908480.24457220.89286680.534077410.071309670.964176490.378541990.035823511.00000000因子荷载:表6.5主成分1主成分2主成分3主成分4X1X2X30.291-0.5060.577-0.5710.8710.4250.1360.2050.332-0.742-0.4180.404-0.214-0.1110.6880.685X4由于前两个主成分对应的累积贡献率已经达到89.287,因此选取主成分的数目为2.5 对某初中 12 岁的女生进行体检,测量其
23、身高得 58 个样本,并算得x(x-i,x2,X3,x4)的样本协方差为19.94S10.50 23.566.598.63试进行样本主成分分析解首先计算样本的相关系数矩阵:xi、体重X2、胸围X3和坐高X4,共测19.7120.953.937.557.9710.484410.32240.887210.70330.59760.31251设相关系数矩阵的特征值和特征向量分别为d和v阵,计算得到0.05460000.31260d=0000000.9647002.6681即四个特征值依次为:2.6681,0.9647,0.3126,0.0546,前两个主成分的累计贡献率为:90.8471%,因此提取主
24、成分为2四个特征根相应的特征向量为0.06000.70600.17430.19320.65870.53330.34040.60400.48460.46200.56420.48060.48700.7317v一0.60570.3069因此,两个主成分的表达式为:z-i0.06x1Z20.7317X20.6057 x3 0.3069 x40.706x10.1743x20.1932x30.6587x46 比较因子分析和主成分分析模型的异同,阐明两者的关系解(1)提取公因子的方法主要有主成分法和公因子法若采取主成分法,则主成分分析和 因子分析基本等价,该法从解释变量的变异的角度出发,尽量使变量的方差能被
25、主成分解释;而公因子法主要从解释变量的相关性角度,分析目的重在确定结构时则用到该法.尽量使变量的相关程度能被公因子解释,当因子(2)主成分分析和因子分析都是在多个原始变量中通过他们之间的内部相关性来获得新的变量,达到既减少分析指标个数,又能概括原始指标主要信息的目的.但他们各有其特点:主成分分析是将 n 个原始变量提取 m 个支配原始变量的公因子,和 1 个特殊因子,各 因子之间可以相关或不相关(3)统用降维的方法,但差异也很明显:主成分分析把方差划分为不同的正交成分,而因子分析则把方差化分为不同的起因因子;阵出发,且必须把主成分划分为因子.因子分析中的特征值的计算只能从相关系数矩(4)因子分
26、析提取的公因子比主成分分析提取的主成分更具有可解释性(5)两者分析的实质及重点不同主成分的数学模型为Y AX,因子分析的数学模型为X AF因而可知主成分分析是实际上是线性变换,无假设检验,而因子分析是统计而因子模型,某些因子模型是可以得到假设检验的;分析重在解释原始变量之间的关系主成分分析主要综合原始数据的信息,(6)SPSS 数据的实现:两者都通过 analyze ata reduction Factor 过程实现,但主成分分析主要使用descriptires”extraction”stores 对话框,而因子分析处使用这些外,还可使用rotaction 对话框进行因子旋转.7 试对第 4
27、题的变量作因子分析,并将结果和上面的结果进行比较解 用 SPSS 分析,计算结果如下表 6.6-6.8:表6.6反应压缩比情况表初始值前一年11月12日的降水量当年7月均温当年7月降雨量月日辐射提取方法:主成分法提取值1.0001.0001.0001.000.219.665.864.845计算的相关系数矩阵的特征值和方差贡献率:表6.7方差解释度初始特征根方差百分主成分总计比%累积百分比%总计提取因子的方差解释度方差百分比%累积百分比%1234提取2.593.978.285.143方64.82924.4577.1313.582法64.8292.59364.82964.82989.28796.4
28、18100.000:主成分法表6.8主成分矩阵主成分1前一年11月12日的降水量当年7月均温当年7月降雨量月日辐射-.468.815-.930.9198 为研究某一树种的叶片形态,选取 50 片叶测量其长度X1(mm)和宽度X2(mm),按样本数据求得其平均值和协方差矩阵为:X 134,X?求出相关系数阵R,并由R出发作因子分析;92,S90 4848 45S1)求相关系数矩阵:90484890,R10.73030.730312)用只软件求 R 的特征根及其相应的特征向量,软件输出结果如下:$values1 2.99393809$vectors,1,21,0.7071068-0.7071068
29、2,0.707106810.072738090.70710682.9939,20.0727,(-0.7071,0.7071)(0.7071,0.7071),3)求载荷矩阵 A:A1.22350.19071.22350.19070.98810.98810.1540.154hj 1.5333,h21 21.53 33,A*Ui 1,U221,V120.3043M 0.304322Ai 1Ui2,B0ii 1V0,C。i 1(Ui2Vi2)0.9074,D。2UiVi0i 19 1981 年,生物学家Grogan和Wirth对两种蠓虫Af和Apf根据其触角长度X1和翼长X2进行了分类,分类的数据资料
30、如下:AfX1X311.241.2721.361.74231.381.6441.381.8231.201.8651.381.9061.401.70571.481.8281.541.8261.301.96Apf11.141.7841.262.00X1X21.181.961.282.00解(1)建立 Fisher 判别模型(19 舁(1.42,1.75)T,219s 加(炖列0.08480.149A0.1490.3912 20.0198 0.02180.02180.039AA A 0.008 0.013 n2 20.013 0.033T0.19,0.181.325,1.84T345.05135.4
31、2135.4283.33,带入曰航判别函数(N,X2)(1.325,1.84)345.05135.42135.4283.33O.19,。1891.3017x141.3369 x2 44.534(2)把三个样本(1.24,1.80),(1.28,1.84),(1.4,2.04)带入模型,得到结果:三个样本均属于 Apf 类.10 在两个玉米品种之间进行判别:137 玉米G1和甜玉米G2,选取的两个变量是:x1玉米果穗长;X2玉米果穗直径,两个类的样本容量为均值和样本协方差为:n1=n2=40,实际算得两个类的样本9.6613.7203.720 3.410_%18.56_5.98,X225.344
32、.12,8.1204.4584.4584.350S2试建立G,G2的Bayes类线性判别函数.解因为已知两类的样本均值和样本协方差为:X1(18.56,5.98),x2T(25.34,4.12),TS8.120 4.4584.458 4.350 2S9.661 3.7203.720 3.410可计算得到修正的公共协方差矩阵和逆矩阵带入A An2 20.2280.1450.1450.0995.6393.738.25147.3821.95,5.0516.78,1.86,-21-Fisher 判别函数W x(x-(122)1-1 2()丁(x1,x2)21.95,5.055.638.2593.73147.388,1.86T74.3x196.95X21141.29(1)试建立Af和Apf的Fisher判别模型;(2)对样本(1.24,1.80),(1.28,1.84),(1.40,2.04)进行判别分类