《清华大学 杨虎 应用数理统计课后习题参考答案3.doc》由会员分享,可在线阅读,更多相关《清华大学 杨虎 应用数理统计课后习题参考答案3.doc(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流清华大学 杨虎 应用数理统计课后习题参考答案3.精品文档.习题五1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:kg)日 期重 量124910 5500 5800 5740 5710 5440 5680 5240 5600 5400 5410 5430 5400 5640 5700 5660 5700 5610 5700 5610 5400试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05)解 根据问题,因素表示日期,试验指标为钢锭重量,水平为5.假设样本观测值来源于正态总体 .检验的问题:不全相等 .计算结果:表
2、5.1 单因素方差分析表方差来源自由度平方和均方F值P值因素A误差41522768021617556920144123.94960.02199 *注释: 当=0.001表示非常显著,标记为 *,类似地,= 0.01,0.05,分别标记为 * ,* . 查表,因为,或= 0.02199 0.05,所以接受,认为在四种不同催化剂下平均得率无显著差异 .3 试验某种钢的冲击值(kg m/cm2),影响该指标的因素有两个,一是含铜量A,另一个是温度B,不同状态下的实测数据如下: 试验温度含铜量20 0 -20 -400.2%0.4%0.8%10.6 7.0 4.2 4.211.6 11.0 6.8 6
3、.314.5 13.3 11.5 8.7试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(=0.05)解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用.设因素分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12.假设样本观测值来源于正态总体 .记为对应于的主效应;记为对应于的主效应;检验的问题:(1)全部等于零,不全等于零; (2)全部等于零,不全等于零;计算结果: 表5.3 双因素无重复试验的方差分析表方差来源自由度平方和均方F值P值因素A260.781730.390834.58960.0005*因素B误差总和361164.31585.2717130.369221.43
4、860.878624.40060.0009* 查表,显然计算值分别大于查表值,或= 0.0005,0.0009 均显著小于0.05,所以拒绝,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用.4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:日产量操 作 工机 器B1B2B3M115,15,1719,19,1616,18,21M217,17,1715,15,1519,22,22M315,17,1618,17,1618,18,18M418,20,2215,16,1717,17,17设每个工人在每台机器上的日产量都服从正态分布且方差相同 .试检验:(=0.05)1) 操作工之间的
5、差异是否显著?2) 机器之间的差异是否显著?3) 它们的交互作用是否显著?解 根据问题,这是一个双因素等重复(3次)试验的问题,要考虑交互作用.设因素分别表示为机器和操作,试验指标为日产量,水平为12.假设样本观测值来源于正态总体 , .记为对应于的主效应;记为对应于的主效应;记为对应于交互作用的主效应;检验的问题:(1)全部等于零,不全等于零; (2)全部等于零,不全等于零; (3)全部等于零,不全等于零;计算结果: 表5.4 双因素无重复试验的方差分析表方差来源自由度平方和均方F值P值因素A因素B相互效应AB误差总和32624352.75027.16773.541.333144.750.9
6、1713.58312.2501.7220.53237.88717.11290.66450.00233*0.00192*查表,计算值 ,或,而均显著小于0.05,所以拒绝,接受,认为操作工之间的差异显著,机器之间的差异不显著,它们之间的交互作用显著 .5 某轴承厂为了提高轴承圈退火的质量,制定因素水平分级如下表所示因素上升温度保温时间(h)出炉温度水平18006400水平28208500试问应选用哪张正交表来安排试验,并写出第三号试验条件;又如果试验结果为试验号1 2 3 4硬度合格率 100 45 85 70试填好正交试验结果分析表并对试验结果进行直观分析和方差分析 .解 根据题意,这是一个3
7、因素2水平的试验问题 .试验指标为硬度的合格率 .应选择正交表来安排试验,随机生成正交试验表如下:表5.5 试验案表方表头设计ABC空列硬度合格率(%)列号123411212100221214531122854221170由此可见第三号试验条件为:上升温度800、保温时间6h、出炉温度500 .直观分析需要计算K值,计算结果如下:表5.6 计算表表头设计ABC空列硬度合格率(%)列号123411212100221214531122854221170185130170115K=300P=22500Q=24150=325011517013018523725229002290023725122540
8、04001225直观分析 由计算的K值知,因素A、B、C的极差分别为70,40,40,因此主次关系为,B,C相当 .由于试验指标为硬度的合格率,应该是越大越好,所以各确定因素的水平分别是,即最佳的水平组合是,即最佳搭配为:上升温度800、保温时间8h、出炉温度400.采用方差分析法,计算得下表:表5.7 方差分析表方差来源平方和自由度均方差F值A1225112251B40014000.33C40014000.33误差122511225总和32504如果显著性检验水平取,则查表得,显然计算的F值均小于查表值,所以认为三个因素对结果影响都显著 .6 某良种繁殖场为了提高水稻产量,制定试验的因素位级
9、表如下:因素品种密度(颗/100m2)施肥量(kg/100m2)位级1位级2位级3窄叶青8号南二矮5号珍珠矮11号4.503.753.000.750.3751.125问应选用哪张正交表安排试验,并写出第8号试验的条件;如果9组试验结果为(单位:kg/100m2):62.925,57.075,51.6,55.05,58.05,56.55,63.225,50.7,54.45,试对该正交试验结果进行直观分析和方差分析.解 该问题属于3因素3水平的试验问题,试验指标为水稻产量 .根据题意应选择正交表来安排试验,随机生成正交表如下:表5.8 试验安排表表头设计ABC实验结果 产量(kg/m2%)列号12
10、3111162.925212257.075313351.6421255.05522358.05623156.55731363.225832150.7933254.45由表可知,第8号试验的条件:品种(A3)珍珠矮11号,插值密度(B2)3.75棵/100m2 ,施肥量(C1)0.75kg/100m2纯氨;直观分析需要计算K值,计算结果如下:表5.9 计算表表头设计ABC实验结果 产量(kg/m2%)列号123111162.925212257.075313351.6421255.05522358.05623156.55731363.225832150.7933254.4557.2565556.1
11、2K=174.32560.455.2854.256.7255.5257.62同上题进行直观分析,得出K值的大小关系为:由直观分析看出:本例较好的水平搭配是: 采用方差分析法,计算得下表:表5.10 方差分析表方差来源平方和自由度均方差F值A1.75920.879 0.0223B65.861232.9310.8361C6.66023.3300.0845误差78.776239.38839.388,所以认为三个因素对结果影响都不显著.7 在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比A,吡啶量B和反应时间C三个因素,它们各取了7个水平如下:原料配比A:1.0,1.4,1.8,2.2,2.6,
12、3.0,3.4吡啶量B:10,13,16,19,22,25,28反应时间C:0.5,1.0,1.5,2.0,2.5,3.0,3.5试选用合适的均匀设计表安排试验,并写出第7号试验的条件;如果7组试验的结果(收率)为:0.33,0.336,0.294,0.476,0.209,0.451,0.482,试对该均匀试验结果进行直观分析并通过回归分析发现可能更好的工艺条件.解 根据题意选择均匀设计表来安排试验,有3个因素,根据使用表,实验安排如:表5.11 试验安排表ABC收率列号12311230.33224 6 0.33633620.29444150.47655310.20966540.4517777
13、0.482所以 第7号实验的条件为:原配料比3.4,吡啶量28ml,反应时间3.5h.通过直观分析,最好的实验条件是:原配料比3.4,吡啶量28ml,反应时间3.5h.通过回归分析,最合适的实验条件是:原配料比2.6,吡啶量16ml,反应时间0.5h.习题六1 从某中学高二女生中随机选取8名,测得其升高、体重如下: 1 2 3 4 5 6 7 8身高(cm)160 159 160 157 169 162 165 154体重(kg) 49 46 53 41 49 50 48 43在绝对距离下,试用最短距离法和离差平方和法对其进行聚类分析. 解 由R软件,用最短距离(左)和差离平方和法(右)对题目
14、进行聚类分析如下图6.1,表6.1和表6.2:最短距离法 离差平方和法图6.1 聚类树形图表6.1 聚类附表(最短距离法)步骤聚类合并系数首次出现的阶段类别下一步 组 1组 2 组 1组 2 1165.00000221210.00010434813.00000741713.00020551313.00040661517.00050771429.000630表6.2 聚类附表(离差平方和法)步骤聚类合并系数首次出现的阶段类别下一步 组 1组 2 组 1组 2 1162.5000042489.00000735717.50000641326.33310551244.750406615106.8335
15、37714257.3756202 已知五个变量的距离矩阵为 试用最短距离法和最长距离法对这些变量进行聚类,并画出聚类图和二分树.解 针对距离矩阵1),采用两种方法计算如下.最短距离法的聚类步骤如下:a )将,聚类图和树状图如图6.2:图6.2 聚类图(左)与树状图(右)最长距离法与最短距离法类似,步骤如下: a),聚类图和树状图如图6.3:图6.3 聚类图(左)与树状图(右)(2)针对距离矩阵2)最短距离法的聚类步骤如下a)聚类图和树状图如图6.4:图6.4 聚类图(左)与树状图(右)由于本题数据的特殊性,最长距离法与最短距离法结果相同(略).(3) 最短距离法的聚类步骤如下,聚类图和树状图如
16、图6.5:图6.5 聚类图(左)与树状图(右)由于本题数据的特殊性,最长距离法与最短距离法结果相同(略).3 在一项关于作物对土壤营养的反应的研究中,要测定土壤的总磷量和总氮量(占干物质重的百分比),今对10份土样测得数据如下: 土样 变量 1 2 3 4 5 6 7 8 9 10总磷量()总氮量()0.12 0.15 0.36 0.17 0.14 0.06 0.10 0.11 0.11 0.120.63 1.19 2.30 1.29 0.73 0.52 0.33 0.61 0.47 0.66在绝对距离下,试用重心法对其进行聚类分析.解 由R软件得到重心法聚类分析的结果如图6.6与表6.3:图
17、6.6 聚类树形图表6.3 聚类过程记录表步骤聚类合并系数首次出现的阶段类别下一步组 1组 2组 1组 2118.0010022110.002104369.005006415.010207524.010008667.027307716.048468812.4597599132.5728004 1975年Dagnelie收集了11年的气象数据资料如下表 变量 年序 x1 x2 x3 x4 123456789101187.9 19.6 1.0 1661 89.9 15.2 90.1 968153.0 19.7 56.6 1353132.1 17.0 91.0 1293 88.8 18.3 93.7
18、 1153220.9 17.8 106.9 1286117.7 17.8 65.5 1104109.0 18.3 41.8 1574156.1 17.8 57.4 1222181.5 16.8 140.6 902181.4 17.0 74.3 1150其中:x1前一年11月12日的降水量;x27月均温;x37月降雨量;x4月日辐射,试对这四个气象因子进行主成分分析.解 由R软件分析得到如下表6.4,6.5:表6.4 各主成分的重要性:主成分1主成分2主成分3主成分4标准差1.61033490.98908480.534077410.37854199方差贡献率0.64829470.24457220
19、.071309670.03582351累积贡献率0.64829470.89286680.964176491.00000000表6.5 因子荷载:主成分1主成分2主成分3主成分4X10.2910.8710.332-0.214X2-0.5060.425-0.742-0.111X30.5770.136-0.4180.688X4-0.5710.2050.4040.685由于前两个主成分对应的累积贡献率已经达到89.287,因此选取主成分的数目为2.5 对某初中12岁的女生进行体检,测量其身高x1、体重x2、胸围x3和坐高x4,共测得58个样本,并算得的样本协方差为试进行样本主成分分析.解 首先计算样本
20、的相关系数矩阵:设相关系数矩阵的特征值和特征向量分别为和阵,计算得到即四个特征值依次为:2.6681,0.9647,0.3126,0.0546,前两个主成分的累计贡献率为:90.8471%,因此提取主成分为2.四个特征根相应的特征向量为因此,两个主成分的表达式为:6 比较因子分析和主成分分析模型的异同,阐明两者的关系.解 (1)提取公因子的方法主要有主成分法和公因子法.若采取主成分法,则主成分分析和因子分析基本等价,该法从解释变量的变异的角度出发,尽量使变量的方差能被主成分解释;而公因子法主要从解释变量的相关性角度,尽量使变量的相关程度能被公因子解释,当因子分析目的重在确定结构时则用到该法.
21、(2)主成分分析和因子分析都是在多个原始变量中通过他们之间的内部相关性来获得新的变量,达到既减少分析指标个数,又能概括原始指标主要信息的目的.但他们各有其特点:主成分分析是将n个原始变量提取m个支配原始变量的公因子,和1个特殊因子,各因子之间可以相关或不相关. (3)统用降维的方法,但差异也很明显:主成分分析把方差划分为不同的正交成分,而因子分析则把方差化分为不同的起因因子;因子分析中的特征值的计算只能从相关系数矩阵出发,且必须把主成分划分为因子. (4)因子分析提取的公因子比主成分分析提取的主成分更具有可解释性. (5)两者分析的实质及重点不同.主成分的数学模型为,因子分析的数学模型为.因而
22、可知主成分分析是实际上是线性变换,无假设检验,而因子分析是统计模型,某些因子模型是可以得到假设检验的;主成分分析主要综合原始数据的信息,而因子分析重在解释原始变量之间的关系. (6)SPSS数据的实现:两者都通过“analyze data reduction Factor”过程实现,但主成分分析主要使用“descriptires”,“extraction”,“stores”对话框,而因子分析处使用这些外,还可使用“rotaction”对话框进行因子旋转.7 试对第4题的变量作因子分析,并将结果和上面的结果进行比较.解 用SPSS分析,计算结果如下表6.6-6.8:表6.6 反应压缩比情况表初始
23、值提取值前一年11月12日的降水量1.000.219当年7月均温1.000.665当年7月降雨量1.000.864月日辐射1.000.845提取方法: 主成分法计算的相关系数矩阵的特征值和方差贡献率:表6.7 方差解释度主成分初始特征根提取因子的方差解释度总计方差百分比%累积百分比%总计方差百分比%累积百分比%12.59364.82964.8292.59364.82964.8292.97824.45789.287 3.2857.13196.418 4.1433.582100.000 提取方法: 主成分法表6.8 主成分矩阵主成分1前一年11月12日的降水量-.468当年7月均温.815当年7月
24、降雨量-.930月日辐射.9198 为研究某一树种的叶片形态,选取50片叶测量其长度x1(mm)和宽度x2(mm),按样本数据求得其平均值和协方差矩阵为:求出相关系数阵R,并由R出发作因子分析;解1)求相关系数矩阵:2)用R软件求R的特征根及其相应的特征向量,软件输出结果如下:$values1 2.99393809 0.07273809$vectors ,1 ,21, 0.7071068 -0.70710682, 0.7071068 0.70710683) 求载荷矩阵A:4) 9 1981年,生物学家Grogan和Wirth对两种蠓虫Af和Apf根据其触角长度x1和翼长x2进行了分类,分类的数
25、据资料如下:Af12345678 x11.241.361.381.381.381.401.481.54x21.271.741.641.821.901.701.821.82Apf123456x11.141.181.201.261.281.30x21.781.961.862.002.001.96(1)试建立Af和Apf的Fisher判别模型; (2)对样本(1.24,1.80),(1.28,1.84),(1.40,2.04)进行判别分类.解 (1)建立Fisher判别模型, 带入Fisher判别函数(2)把三个样本(1.24,1.80),(1.28,1.84),(1.4,2.04)带入模型,得到结果:三个样本均属于Apf类.10 在两个玉米品种之间进行判别:137玉米G1和甜玉米G2,选取的两个变量是:x1玉米果穗长;x2玉米果穗直径,两个类的样本容量为n1n240,实际算得两个类的样本均值和样本协方差为:试建立G1,G2的Bayes类线性判别函数.解 因为已知两类的样本均值和样本协方差为:可计算得到修正的公共协方差矩阵和逆矩阵带入Fisher判别函数