《清华大学 杨虎 应用数理统计课后习题参考答案2.doc》由会员分享,可在线阅读,更多相关《清华大学 杨虎 应用数理统计课后习题参考答案2.doc(85页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date清华大学 杨虎 应用数理统计课后习题参考答案2清华大学 杨虎 应用数理统计课后习题参考答案2习题三1 正常情况下,某炼铁炉的铁水含碳量.现在测试了5炉铁水,其含碳量分别为4.28,4.40,4.42,4.35,4.37. 如果方差没有改变,问总体的均值有无显著变化?如果总体均值没有改变,问总体方差是否有显著变化()?解 由题意知 ,设立统计原假设 拒绝域为 ,临界值
2、, 由于 ,所以拒绝,总体的均值有显著性变化.设立统计原假设 由于,所以当时 拒绝域为 由于,所以拒绝,总体的方差有显著性变化.2 一种电子元件,要求其寿命不得低于1000h .现抽测25件,得其均值为=950h .已知该种元件寿命,问这批元件是否合格()?解 由题意知 ,设立统计原假设拒绝域为 临界值为 由于 ,所以拒绝,元件不合格.3 某食品厂用自动装罐机装罐头食品,每罐标准重量为500g,现从某天生产的罐头中随机抽测9罐,其重量分别为510,505,498,503,492,502,497,506,495(g),假定罐头重量服从正态分布. 问 (1)机器工作是否正常()? 2)能否认为这批
3、罐头重量的方差为5.52()?解 (1)设X表示罐头的重量(单位:g). 由题意知,已知设立统计原假设 ,拒绝域 当时,临界值 ,由于,所以接受,机器工作正常.(2)设X表示罐头的重量(单位:g). 由题意知,已知设立统计原假设 拒绝域为 当=0.05时,可得由于,所以接受,可以认为方差为.4 某部门对当前市场的鸡蛋价格情况进行调查,抽查某市20个集市上鸡蛋的平均售价为3.399(元/500克),标准差为0.269(元/500克).已知往年的平均售价一直稳定在3.25(元/500克)左右, 问该市当前的鸡蛋售价是否明显高于往年?()解 设X表示市场鸡蛋的价格(单位:元/克),由题意知设立统计原
4、假设 , 拒绝域为 当=0.05时,由于所以拒绝,当前的鸡蛋售价明显高于往年.5 已知某厂生产的维尼纶纤度,某日抽测8根纤维,其纤度分别为1.32,1.41,1.55,1.36,1.40,1.50,1.44,1.39,问这天生产的维尼纶纤度的方差是否明显变大了()?解 由题意知 ,设立统计原假设 拒绝域为, 当时, 由于,所以拒绝,认为强度的方差明显变大.6 某种电子元件,要求平均寿命不得低于2000,标准差不得超过130.现从一批该种元件中抽取25只,测得寿命均值,标准差.设元件寿命服从正态分布,试在显著水平 =0.05下, 确定这批元件是否合格.解 设X表示电子元件的平均寿命(单位:),由
5、题意知设立统计原假设 拒绝域为 当时,由于 ,所以接受,即这批电子元件的寿命是合格的.7 设为来自总体的样本,已知对统计假 的拒绝域为.1)当时,求犯两类错的概率与;2)证明:当时,0,0.解 (1)由题意知 犯第一类错误的概率为犯第二类错误的概率为(2)若成立,则 当,所以同理 8 设需要对某一正态总体的均值进行假设检验H0:= 15,H1: 15取检验水平=0.05,试写出检验H0的统计量和拒绝域.若要求当H1中的=13时犯第二类错误的概率不超过=0.05,估计所需的样本容量n.解 由题意知 ,已知, 设立统计原假设 则拒绝域为,其中临界值犯第二类错误的概率即 , 化简得 .9 设为来自总
6、体的样本,为已知, 对假设: 其中,试证明:解 (1),由题意知 犯第一,二类错误分别为,则有 (2)由题意知 ,犯第一,二类错误分别为,则有10 设为总体样本,对假设:的拒绝域为 . 求犯第类错误的概率和犯第类错的概率.解 由题意知 , 统计假设为 . 拒绝域为 则犯第一,二类错误的概率分别是11 设总体是密度函数是 统计假设 .现从总体中抽取样本,拒绝域,求:两类错误的概率解 由题意知当此时 当此时 12 设总体,根据假设检验的基本原理,对统计假设: ;,试分析其拒绝域.解 由题意知 ,当成立时所以拒绝域为 当成立时所以拒绝域为13 设总体根据假设检验的基本原理,对统计假设:(1);(2)
7、试分析其拒绝域.解 由题意知 (1)假设统计假设为 其中已知当成立时,拒绝域形式为 由 ,可得所以 ,由此可得拒绝域形式为(2)假设统计假设为 其中未知当成立时,选择拒绝域为 ,由得 所以,由此可得拒绝域形式为14 从甲、乙两煤矿各取若干样品,得其含灰率(%)为,甲:24.3, 20.8, 23.7, 21.3, 17.4, 乙:18.2, 16.9, 20.2, 16.7 .假定含灰率均服从正态分布且,问甲、乙两煤矿的含灰率有无显著差异 ()? 解 由题意知 设统计假设为 其中当时临界值 拒绝域为而 15 设甲、乙两种零件彼此可以代替,但乙零件比甲零件制造简单,造价也低.经过试验获得它们的抗
8、拉强度分别为(单位:kg/cm):甲:88,87,92,90,91 乙:89,89,90,84,88假定两种零件的抗拉强度都服从正态分布,且 =.问甲种零件的抗拉强度是否比乙种的高()?解 由题意知 设统计假设为 ,其中当时临界值 拒绝域为而 ,所以接受,认为甲的抗拉强度比乙的要高.16 甲、乙两车床生产同一种零件.现从这两车床产生的产品中分别抽取8个和9个,测得其外径(单位:mm)为:甲:15.0,14.5,15.2,15.5,14.8,15.1,15.2,14.8乙:15.2,15.0,14.8,15.2,15.0,15.0,14.8,15.1,14.8假定其外径都服从正态分布,问乙车床的
9、加工精度是否比甲车床的高()?解 由题意知 设统计假设为 ,其中当时 ,临界值 拒绝域为,而,接受,认为乙的精度高.17 要比较甲、乙两种轮胎的耐磨性,现从甲、乙两种轮胎中各取8个,各取一个组成一对,再随机选取8架飞机,将8对轮胎磨损量(单位:mg)数据列表如下:(甲)49005220550060206340766086504870(乙)49304900514057006110688079305010 试问这两种轮胎的耐磨性有无显著差异?(). 假定甲、乙两种轮胎的磨损量分别满足且两个样本相互独立.解 由题意知 设统计假设为 ,其中当时,令 拒绝域为,临界值 而,所以接受,认为两种轮胎耐磨性无
10、显著差异.18 设总体, 由两总体分别抽取样本:4.4,4.0,2.0,4.8 :6.0,1.0,3.2,0.4 1)能否认为 ()? 2)能否认为 ()?解 (1) 由题意知 设统计假设为 ,其中令,则有,当时,拒绝域为,而,所以(2) 由题意知 设统计假设为 ,其中其中,拒绝域为临界值 而19 从过去几年收集的大量记录发现,某种癌症用外科方法治疗只有2%的治愈率.一个主张化学疗法的医生认为他的非外科方法比外科方法更有效.为了用实验数据证 实他的看法,他用他的方法治疗200个癌症病人,其中有6个治好了.这个医生断 言这种样本中的3%治愈率足够证实他的看法.(1)试用假设检验方法检验这个医生的
11、看法;(2)如果该医生实际得到了4.5%治愈率,问检验将证实化学疗法比外科方法更有效的概率是多少?解 (1) 记每个病人的治愈情况为,则有设统计假设为 ,其中 拒绝域为,临界值 而 (2) 不犯第二类错误的概率 由,可得 由中心极限定理得 20 在某公路上,50min之间,观察每15s内通过的汽车数,得下表通过的汽车数量0 1 2 3 4 5次数f92 68 28 11 1 0问能否认为通过的汽车辆数服从泊松分布()?解 设统计假设为 记 则有检验统计量的值为21 对某厂生产的汽缸螺栓口径进行100次抽样检验,测得100数据分组列表如下:组限10.9310.9510.9510.9710.971
12、0.9910.9911.01频数582034组限11.0111.0311.0311.0511.0511.0711.0711.09频数17664试对螺栓的口径的分布做假设检验().解 设表示螺栓的口径,分布函数为,统计假设为,其中在成立的情况下,计算得由得所以检验统计量的值为由此应该22 检查产品质量时,每次抽取10个产品检验,共抽取100次,得下表:次品数0 1 2 3 4 5 6 7 8 9 10频数35 40 18 5 1 1 0 0 0 0 0问次品数是否服从二项分布()?解 设表示抽取的次品数,分布函数为,统计假设为,其中在成立的情况下, 计算得 检验统计量的值为0020因此23 请7
13、1人比较A、B两种型号电视机的画面好坏,认为A好的有23人,认为B好的有45人,拿不定主意的有3人,是否可以认为B的画面比A的好()?解 设表示A种型号电视机的画面要好些,表示B中型号电视机画面要好些分布函数分别为,统计假设为由题意知 检验统计量 而,所以24 为比较两车间(生产同一种产品)的产品某项指标的波动情况,各依次抽取12个产品进行测量,得下表甲1.131.261.161.410.861.391.211.221.200.621.181.34乙1.211.310.991.591.411.481.311.121.601.381.601.84问这两车间所生产的产品的该项指标分布是否相同()?
14、解 设分别表示甲乙两车间所生产产品的指标分布,分布函数分别,统计假设为 检验统计量为秩和,易知的样本值为且拒绝域为而,所以25 观察两班组的劳动生产率(件/h),得下表:第1班组 28 33 39 40 41 42 45 46 47第2班组 34 40 41 42 43 44 46 48 49问两班组的劳动生产率是否相同(=0.05)?解 设分别表示两个组的劳动生产率,分布函数分别为,统计假设为检验统计量为秩和,易知的样本值为拒绝域形式为而,因此, 所以26 观观察得两样本值如下: 2.36 3.14 7.52 3.48 2.76 5.43 6.54 7.41 4.38 4.25 6.54 3
15、.28 7.21 6.54问这两样本是否来自同一总体(=0.05)?解 设分别表示,两个样本,分布函数分别是,统计假设为检验统计量为秩和,易知的样本值为拒绝域形式为而,因此, 所以27 某种动物配偶的后代按体格的属性分为三类,各类的数目是:10,53,46,按照某种遗传模型其比率之比应为:,问数据与模型是否相符()?解 设体格的属性为样本,由题意知其密度函数为,其中统计假设为似然函数为解得最大似然统计量为 则 拒绝域为而 所以28 在某地区的人口调查中发现:15729245个男人中有3497个是聋哑人.16799031个女人中有3072个是聋哑人.试检验“聋哑人与性别无关”的假设().解 设表
16、示男人中聋哑人的个数,表示女人中聋哑人的个数,其分布函数分别表示为,. 统计假设为拒绝域为而所以29 下表为某药治疗感冒效果的联列表:年龄疗效 儿童成年老年一般583832128较差284445117显著2318145510910091300试问该药疗效是否与年龄有关(=0.05)?解 设表示该药的疗效与年龄有关,表示该药的疗效与年龄无关,其分布函数分别表示为. 统计假设为拒绝域为而 所以30 某电子仪器厂与协作的电容器厂商定,当电容器厂提供的产品批的不合格率不超过3%时以高于95%的概率接受,当不合格率超过12%时,将以低于10%的概率接受.试为验收者制订验收抽样方案.解 由题意知, 代入式
17、子 选用式子计算求得 ,于是抽查方案是:抽查66件产品,如果抽得的不合格产品,则接受这批产品,否则拒绝这批产品.31 假设一批产品的质量指标(已知),要求质量指标值越小越好.试给出检验抽样方案()的计算公式.若未知,又如何确定检验抽样方案()?若质量高时指质量指标在一个区间时,又如何确定检验抽样方案()?解 (1) 解方程组 得 (2) 若未知,用估计,从而得出公式习题四1 下表数据是退火温度()对黄铜延性效应的试验结果,是以延伸率计算的,且设为正态变量,求对的样本线性回归方程.()300 400 500 600 700 800(%)40 50 55 60 67 70解 利用回归系数的最小二估
18、计:其中代入样本数据得到:样本线性回归方程为:2 证明线性回归函数中(1)回归系数的置信水平为的置信区间为;(2)回归系数的置信水平为的置信区间为.证 (1) 由于,所以,所以 易知 ,其中所以的置信水平为的置信区间为(2) 由,得,与相互独立,所以:根据得到的置信度为的置信区间.3 某河流溶解氧浓度(以百万分之一计)随着水向下游流动时间加长而下降.现测得8组数据如下表所示.求溶解氧浓度对流动时间的样本线性回归方程,并以=0.05对回归显著性作检验.流动时间t(天)0.51.01.61.82.63.23.84.7溶解氧浓度(百万分之一)0.280.290.290.180.170.180.100
19、.12解 利用其中代入样本数据得到: 所以,样本线性回归方程为:拒绝域形式为:,所以回归模型不显著.4 假设是一可控制变量,是一随机变量,服从正态分布.现在不同的值下分别对 进行观测,得如下数据0.250.370.440.550.600.620.680.700.732.572.312.121.921.751.711.601.511.500.750.820.840.870.880.900.951.001.411.331.311.251.201.191.151.00(1)假设与有线性相关关系,求对样本回归直线方程,并求的无偏估计; (2)求回归系数的置信度为95%的置信区间;(3)检验和之间的线性
20、关系是否显著();(4)求 置信度为95%的预测区间;(5)为了把的观测值限制在,需把x的值限制在什么范围?()解 (1) 利用其中计算得所以,样本线性回归方程为:,(2) 根据第二题,的置信区间为,代入值计算得到:,的置信区间为,代入数值计算得到:.(3) 根据检验法,其拒绝域形式为 而 显然,所以和之间具有显著的线性关系.(4) , 则有 (5) 根据(4)的结论,令 解得 5 证明对一元线性回归系数,相互独立的充分必要条件是.证 若要,那么.反之显然也成立,命题的证.6 设组观测值之间有关系式:(其中),且相互独立.(1) 求系数的最小二乘估计量;(2) 证明,其中(3) 求的分布.解
21、(1) 最小化残差平方和: (2) 易知 其中,将其代入上式可得所以, (3) , 同理,易得7 某矿脉中13个相邻样本点处某种金属的含量与样本点对原点的距离有如下观测值23457810106.42108.20109.58109.50110.00109.93110.49111415161819110.59110.60110.90110.76111.00111.20分别按(1);(2);(3).建立对的回归方程,并用相关系数指出其中哪一种相关最大.解 (1) 令,根据最小二乘法得到,正规方程:,最后得到所以:样本线性回归方程为:,(2) 令,得到所以:样本线性回归方程为:,(3) 令,得到所以:
22、样本线性回归方程为:,综上,,所以第三种模型所表示的的相关性最大.8 设线性模型 其中()且相互独立,试求、的LS估计.解 令则线性模型可转化为 根据 , 令 可得 即 9 养猪场为估算猪的毛重,随机抽测了14头猪的身长(cm),肚围(cm)与体重(kg),得数据如下表所示,试求一个型的经验公式.身长(cm)41 45 51 52 59 62 69 72 78 80 90 92 98 103肚围(cm)49 58 62 71 62 74 71 74 79 84 85 94 91 95体重(kg)28 39 41 44 43 50 51 57 63 66 70 76 80 84解 由多元线性模型
23、得:代入数值得到:同样得到:10 某种商品的需求量,消费者的平均收入和商品价格的统计数据如下表所示.试求对、的线性回归方程.10006001200500300400130011001300300576687543910075807050659010011060解 建立回归模型根据 ,可求得的LS估计为 代入,得 则回归方程为:11 设组观测值之间有如下关系: ,且相互独立.(1)求系数的最小二乘估计量;(2)设,证明:解 (1) (2)12 已有观测数据如下0 1 2 3 4 5 6 74.6 4.2 6.5 8.7 9.0 7.3 5.5 3.2(1)求形如的回归方程;(2)对上述回归方程的显著性作检验;(3)求当=5.5时的估计值.解 (1) 令,求得回归方程为:(2) 拒绝域形式为:,所以回归方程具有显著性(3) 将代入回归方程,得到13 设和变量有形为,的回归方程模型,试用最小二乘法求出的估计.解 令 残差平方和为 令 ,得到 .-