《清华大学杨虎应用数理统计课后习题参考答案3.docx》由会员分享,可在线阅读,更多相关《清华大学杨虎应用数理统计课后习题参考答案3.docx(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、习题五1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:单位:日 期重 量124910 5500 5800 5740 5710 5440 5680 5240 5600 5400 5410 5430 5400 5640 5700 5660 5700 5610 5700 5610 5400试检验不同日期生产的钢锭的平均重量有无显著差异?=0.05解 依据问题,因素表示日期,试验指标为钢锭重量,水平为5.假设样本观测值来源于正态总体 .检验的问题:不全相等 .计算结果:表5.1 单因素方差分析表方差来源自由度平方和均方F值P值因素A误差41522768021617556920144120.0
2、2199 *注释: 当=表示特殊显著,标记为 *,类似地,=,分别标记为 * ,* . 查表,因为,或= 0.02199 0.05,所以承受,认为在四种不同催化剂下平均得率无显著差异 .3 试验某种钢的冲击值 2,影响该指标的因素有两个,一是含铜量A,另一个是温度B,不同状态下的实测数据如下: 试验温度含铜量20 0 -20 -400.2%0.4%0.8%试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?=0.05解 依据问题,这是一个双因素无重复试验的问题,不考虑交互作用.设因素分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12.假设样本观测值来源于正态总体 .记为对应于的主效应;
3、记为对应于的主效应;检验的问题:1全部等于零,不全等于零; 2全部等于零,不全等于零;计算结果: 表5.3 双因素无重复试验的方差分析表方差来源自由度平方和均方F值P值因素A20.0005*因素B误差总和36110.0009* 查表,明显计算值分别大于查表值,或= 0.0005,0.0009 均显著小于0.05,所以拒绝,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用.4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:日产量操 作 工机 器B1B2B3M115,15,1719,19,1616,18,21M217,17,1715,15,1519,22,22M315,17,16
4、18,17,1618,18,18M418,20,2215,16,1717,17,17设每个工人在每台机器上的日产量都听从正态分布且方差一样 .试检验:=0.051) 操作工之间的差异是否显著?2) 机器之间的差异是否显著?3) 它们的交互作用是否显著?解 依据问题,这是一个双因素等重复(3次)试验的问题,要考虑交互作用.设因素分别表示为机器和操作,试验指标为日产量,水平为12.假设样本观测值来源于正态总体 , .记为对应于的主效应;记为对应于的主效应;记为对应于交互作用的主效应;检验的问题:1全部等于零,不全等于零; 2全部等于零,不全等于零; 3全部等于零,不全等于零;计算结果: 表5.4
5、双因素无重复试验的方差分析表方差来源自由度平方和均方F值P值因素A因素B相互效应AB误差总和32624350.00233*0.00192* 查表,计算值 ,或,而均显著小于0.05,所以拒绝,承受,认为操作工之间的差异显著,机器之间的差异不显著,它们之间的交互作用显著 .5 某轴承厂为了提高轴承圈退火的质量,制定因素水平分级如下表所示因素上升温度保温时间(h)出炉温度水平18006400水平28208500试问应选用哪张正交表来支配试验,并写出第三号试验条件;又假如试验结果为试验号1 2 3 4硬度合格率 100 45 85 70试填好正交试验结果分析表并对试验结果进展直观分析和方差分析 .解
6、 依据题意,这是一个3因素2水平的试验问题 .试验指标为硬度的合格率 .应选择正交表来支配试验,随机生成正交试验表如下:表5.5 试验案表方表头设计ABC空列硬度合格率%列号123411212100221214531122854221170由此可见第三号试验条件为:上升温度800, 保温时间6h, 出炉温度500 .直观分析须要计算K值,计算结果如下: 计算表表头设计ABC空列硬度合格率%列号1234112121002212145311228542211701851301701153002250024150=3250115170130185237252290022900237251225400
7、4001225直观分析 由计算的K值知,因素A, B, C的极差分别为70,40,40,因此主次关系为,B,C相当 .由于试验指标为硬度的合格率,应当是越大越好,所以各确定因素的水平分别是,即最正确的水平组合是,即最正确搭配为:上升温度800, 保温时间8h, 出炉温度400.接受方差分析法,计算得下表:表5.7 方差分析表方差来源平方和自由度均方差F值A1225112251B4001400C4001400误差122511225总和32504假如显著性检验水平取,那么查表得,明显计算的F值均小于查表值,所以认为三个因素对结果影响都显著 .6 某良种繁殖场为了提高水稻产量,制定试验的因素位级表如
8、下:因素品种密度颗/100m2施肥量100m2位级1位级2位级3窄叶青8号南二矮5号珍宝矮11号问应选用哪张正交表支配试验,并写出第8号试验的条件;假如9组试验结果为单位:100m2:62.925,57.075,51.6,55.05,58.05,56.55,63.225,50.7,54.45,试对该正交试验结果进展直观分析和方差分析.解 该问题属于3因素3水平的试验问题,试验指标为水稻产量 .依据题意应选择正交表来支配试验,随机生成正交表如下:表5.8 试验支配表表头设计ABC试验结果 产量2%列号123111121223133421252236231731383219332由表可知,第8号试
9、验的条件:品种A3珍宝矮11号,插值密度B22 ,施肥量C12纯氨;直观分析须要计算K值,计算结果如下:表5.9 计算表表头设计ABC试验结果 产量2%列号1231111212231334212522362317313832193325655同上题进展直观分析,得出K值的大小关系为:由直观分析看出:本例较好的水平搭配是: 接受方差分析法,计算得下表:表5.10 方差分析表方差来源平方和自由度均方差F值A20.879 B2C2误差2,所以认为三个因素对结果影响都不显著. 7 在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比A,吡啶量B和反响时间C三个因素,它们各取了7个水平如下:吡啶量B:
10、10,13,16,19,22,25,28试选用适宜的匀整设计表支配试验,并写出第7号试验的条件;假如7组试验的结果收率为:0.33,0.336,0.294,0.476,0.209,0.451,0.482,试对该匀整试验结果进展直观分析并通过回来分析发觉可能更好的工艺条件.解 依据题意选择匀整设计表来支配试验,有3个因素,依据运用表,试验支配如:表5.11 试验支配表ABC收率列号1231123224 6 33624415553166547777所以 第7号试验的条件为:原配料比3.4,吡啶量28,反响时间3.5h.通过直观分析,最好的试验条件是:原配料比3.4,吡啶量28,反响时间3.5h.通
11、过回来分析,最适宜的试验条件是:原配料比2.6,吡啶量16,反响时间0.5h.习题六1 从某中学高二女生中随机选取8名,测得其上升, 体重如下: 1 2 3 4 5 6 7 8身高160 159 160 157 169 162 165 154体重 49 46 53 41 49 50 48 43在确定距离下,试用最短距离法和离差平方和法对其进展聚类分析. 解 由R软件,用最短距离左和差离平方和法右对题目进展聚类分析如下列图6.1,表:最短距离法 离差平方和法图6.1 聚类树形图表6.1 聚类附表(最短距离法)步骤聚类合并系数首次出现的阶段类别下一步 组 1组 2 组 1组 2 116002212
12、104348007417205513406615507714630表6.2 聚类附表(离差平方和法)步骤聚类合并系数首次出现的阶段类别下一步 组 1组 2 组 1组 2 1160042480073570064131055124066155377146202 五个变量的距离矩阵为 试用最短距离法和最长距离法对这些变量进展聚类,并画出聚类图和二分树.解 针对距离矩阵1,接受两种方法计算如下.最短距离法的聚类步骤如下:a 将,聚类图和树状图如:图6.2 聚类图左及树状图右最长距离法及最短距离法类似,步骤如下: a,聚类图和树状图如:图6.3 聚类图左及树状图右2针对距离矩阵2最短距离法的聚类步骤如下
13、a聚类图和树状图如图6.4:图6.4 聚类图左及树状图右由于此题数据的特殊性,最长距离法及最短距离法结果一样略.(3) 最短距离法的聚类步骤如下) ,聚类图和树状图如:图6.5 聚类图左及树状图右由于此题数据的特殊性,最长距离法及最短距离法结果一样(略).3 在一项关于作物对土壤养分的反响的探讨中,要测定土壤的总磷量和总氮量占干物质重的百分比,今对10份土样测得数据如下: 土样 变量 1 2 3 4 5 6 7 8 9 10总磷量总氮量在确定距离下,试用重心法对其进展聚类分析.解 由R软件得到重心法聚类分析的结果:图6.6 聚类树形图表 聚类过程记录表步骤聚类合并系数首次出现的阶段类别下一步组
14、 1组 2组 1组 2118.0010022110.002104369.005006415.010207524.010008667.027307716.048468812.4597599138004 1975年收集了11年的气象数据资料如下表 变量 年序 x1 x2 x3 x4 123456789101187.9 19.6 1.0 1661 89.9 15.2 90.1 968153.0 19.7 56.6 1353132.1 17.0 91.0 1293 88.8 18.3 93.7 1153220.9 17.8 106.9 1286117.7 17.8 65.5 1104109.0 18.
15、3 41.8 1574156.1 17.8 57.4 1222181.5 16.8 140.6 902181.4 17.0 74.3 1150其中:x1前一年11月12日的降水量;x27月均温;x37月降雨量;x4月日辐射,试对这四个气象因子进展主成分分析.解 由R软件分析得到如下:表6.4 各主成分的重要性:主成分1主成分2主成分3主成分4标准差方差奉献率累积奉献率表6.5 因子荷载:主成分1主成分2主成分3主成分4X1X2X3X4由于前两个主成分对应的累积奉献率已经到达89.287,因此选取主成分的数目为2.5 对某初中12岁的女生进展体检,测量其身高x1, 体重x2, 胸围x3和坐高x4
16、,共测得58个样本,并算得的样本协方差为试进展样本主成分分析.解 首先计算样本的相关系数矩阵:设相关系数矩阵的特征值和特征向量分别为和阵,计算得到即,前两个主成分的累计奉献率为:90.8471%,因此提取主成分为2.四个特征根相应的特征向量为因此,两个主成分的表达式为:6 比拟因子分析和主成分分析模型的异同,说明两者的关系.解 1提取公因子的方法主要有主成分法和公因子法.假设实行主成分法,那么主成分分析和因子分析根本等价,该法从说明变量的变异的角度动身,尽量使变量的方差能被主成分说明;而公因子法主要从说明变量的相关性角度,尽量使变量的相关程度能被公因子说明,当因子分析目的重在确定构造时那么用到
17、该法. 2主成分分析和因子分析都是在多个原始变量中通过他们之间的内部相关性来获得新的变量,到达既削减分析指标个数,又能概括原始指标主要信息的目的.但他们各有其特点:主成分分析是将n个原始变量提取m个支配原始变量的公因子,和1个特殊因子,各因子之间可以相关或不相关. 3统用降维的方法,但差异也很明显:主成分分析把方差划分为不同的正交成分,而因子分析那么把方差化分为不同的起因因子;因子分析中的特征值的计算只能从相关系数矩阵动身,且必需把主成分划分为因子. 4因子分析提取的公因子比主成分分析提取的主成分更具有可说明性. 5两者分析的实质及重点不同.主成分的数学模型为,因子分析的数学模型为.因而可知主
18、成分分析是事实上是线性变换,无假设检验,而因子分析是统计模型,某些因子模型是可以得到假设检验的;主成分分析主要综合原始数据的信息,而因子分析重在说明原始变量之间的关系. 6数据的实现:两者都通过“ 过程实现,但主成分分析主要运用“,“,“对话框,而因子分析处运用这些外,还可运用“对话框进展因子旋转.7 试对第4题的变量作因子分析,并将结果和上面的结果进展比拟.解 用分析,计算结果如下表6.6-6.8:表 反响压缩比状况表初始值提取值前一年11月12日的降水量.219当年7月均温.665当年7月降雨量.864月日辐射.845提取方法: 主成分法计算的相关系数矩阵的特征值和方差奉献率:表 方差说明
19、度主成分初始特征根提取因子的方差说明度总计方差百分比%累积百分比%总计方差百分比%累积百分比%12.978 3.285 4.143 提取方法: 主成分法表 主成分矩阵主成分1前一年11月12日的降水量当年7月均温.815当年7月降雨量月日辐射.9198 为探讨某一树种的叶片形态,选取50片叶测量其长度x1和宽度x2,按样本数据求得其平均值和协方差矩阵为:求出相关系数阵R,并由R动身作因子分析;解1求相关系数矩阵:2用R软件求R的特征根及其相应的特征向量,软件输出结果如下:$ $ ,1 ,23) 求载荷矩阵A:4 ,9 1981年,生物学家和对两种蠓虫和依据其触角长度x1和翼长x2进展了分类,分
20、类的数据资料如下:12345678 x1x2123456x1x21试建立和的判别模型; 2对样本1.24,1.80,1.28,1.84,1.40,2.04进展判别分类.解 1建立判别模型, 带入判别函数 2把三个样本1.24,1.80,1.28,1.84,(1.4,2.04)带入模型,得到结果:三个样本均属于类.10 在两个玉米品种之间进展判别:137玉米G1和甜玉米G2,选取的两个变量是:x1玉米果穗长;x2玉米果穗直径,两个类的样本容量为n1n240,实际算得两个类的样本均值和样本协方差为:试建立G1,G2的类线性判别函数.解 因为两类的样本均值和样本协方差为:,可计算得到修正的公共协方差矩阵和逆矩阵,带入判别函数