《统计学课后习题答案(全章节)剖析.doc》由会员分享,可在线阅读,更多相关《统计学课后习题答案(全章节)剖析.doc(215页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date统计学课后习题答案(全章节)剖析第九章第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:7007167287196857096916847057187067157127226917086906927077017087296946816956857066617356656687106936976746586986
2、66696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688要求: (2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。灯泡的使用寿命频数分布表分组频数(只)频率(%)650-66022660-67055670-68066680-6901414690-7002626700-
3、7101818710-7201313720-7301010730-74033740-75033合计1001003.某公司下属40个销售点2012年的商品销售收入数据如下: 单位:万元1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。解:(1) 频数分布表分组频数(个)频率(%)85-9537.595-10561
4、5.0105-115922.5115-1251127.5125-135410.0135-145512.5145-15525.0合计40100(2)茎叶图树茎树叶数据个数891011121314157825703345578802345567789903456795678262239127421第三章、练习题及解答1. 已知下表资料:日产量(件)工人数(人)工人比重(%)2530354045205080361410254018 7合 计200100试根据频数和频率资料,分别计算工人平均日产量。解: 计算表日产量(件)x工人数(人)f工人比重(%)f/fxfxf/f2520105002.53050
5、2515007.535804028001440361814407.2451476303.15合 计200100687034.35根据频数计算工人平均日产量:(件)根据频率计算工人平均日产量:(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表:单位产品成本(元/件)单位数产量比重(%)101212141418234204238合计9100试计算这9个企业的平均单位成本。解:单位产品成本(元/件)单位数产量比重(%)f/f组中值(元)xXf/f1012220112.2121434213
6、5.461418438166.08合计9100-13.74这9个企业的平均单位成本=13.74(元)3.某专业统计学考试成绩资料如下:按成绩分组(分)学生数(人)60以下607070808090 90100 100以上 4 81420 9 5合 计60试计算众数、中位数。解:众数的计算:根据资料知众数在8090这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, (分)中位数的计算:根据和向上累积频数信息知,中位数在8090这一组。(分)4.利用练习题1题资料计算200名工人日产量的标准差,并计算离散系数。(只按照频数计算即可)解: 计算表日产量(件)x工人数(
7、人)f25201748.453050946.125358033.840361149.2145141587.915合 计2005465.55.一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,平均分数是80分,标准差是15分;在B项测试中,平均分数是200分,标准差是50分。一位应试者在A项测试中得了95分,在B项测试中得了225分。与平均分数相比,该位应试者哪一项测试更为理想?解:计算各自的标准分数:,因为A测试的标准分数高于B测试的标准分,所以该测试者A想测试更理想。第四章、练习题及解答1. 随机变量服从标准正态分布,求以下概率:(1);(2);(3)。2. 由30辆汽车构成的一个
8、随机样本,测得每百公里的耗油量(单位:升)数据如下:9.1910.019.609.279.788.829.638.8210.508.839.358.6510.109.4310.129.399.548.519.710.039.499.489.369.1410.099.859.379.649.689.75绘制频数分布直方图,判断汽车的耗油量是否近似服从正态分布。3. 从均值为200、标准差为50的总体中,抽取的简单随机样本,用样本均值估计总体均值。(1)的期望值是多少?(2)的标准差是多少?(3)的概率分布是什么?4. 从=0.4的总体中,抽取一个容量为500的简单随机样本,样本比例为。(1)的期
9、望值是多少?(2)的标准差是多少?(3)的概率分布是什么?5. 假设一个总体共有6个数值:54,55,59,63,64,68。从该总体中按重置抽样方式抽取的简单随机样本。(1)计算总体的均值和方差。(2)一共有多少个可能的样本?(3)抽出所有可能的样本,并计算出每个样本的均值。(4)画出样本均值的频数分布直方图,判断样本均值是否服从正态分布。(5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么?第四章习题答案1.解:由于Z服从标准正态分布,查表得,(1)(2)(3)2.解:对数据进行整理,30个样本数据极差为1.99。将数据分为7组,组距为0.3,如下表所示
10、:分组频数8.51-8.8028.81-9.1039.11-9.4079.41-9.7099.71-10.00310.01-10.30510.31-10.601对应频数直方图为:观察上图,数据基本上拟合正态分布曲线,可以认为汽车耗油量基本服从正态分布。3.解:已知:,同时由于样本量很大,可以看作重置抽样来处理。根据公式4.5可以得到:(1)(2),(3)根据中心极限定理,近似服从均值为200,标准差为5的正态分布。4.解:已知:,同时由于样本量很大,可以看作重置抽样来处理。根据公式4.7可以得到:(1)(2),;(3)根据中心极限定理,p近似服从均值为0.4,标准差为0.0219的正态分布。5
11、.解:(1),;(2)由于从总体中重置抽取的样本,考虑抽取顺序情况下共有种可能样本。(3)如下表所示:样本序号样本单位样本均值样本序号样本单位样本均值154,54541963,5458.5254,5554.52063,5559354,5956.52163,5961454,6358.52263,6363554,64592363,6463.5654,68612463,6865.5755,5454.52564,5459855,55552664,5559.5955,59572764,5961.51055,63592864,6363.51155,6459.52964,64641255,6861.5306
12、4,68661359,5456.53168,54611459,55573268,5561.51559,59593368,5963.51659,63613468,6365.51759,6461.53568,64661859,6863.53668,6868(4)样本均值频数表:分组频数54-56456-58458-60960-62762-64764-66366-682样本均值频数直方图:由上图可以发现,样本均值近似服从正态分布;(5)由样本方差均值公式可以得到:;可以看出,样本均值与总体均值很接近,样本标准差则比总体方差小。第五章、练习题及解答1. 某快餐店想要估计每位顾客午餐的平均花费金额,在为
13、期三周的时间里选取49名顾客组成了一个简单随机样本。(1)假定总体标准差为15元,求样本均值的抽样标准误差;(2)在95%的置信水平下,求估计误差;(3)如果样本均值为120元,求快餐店所有顾客午餐平均花费金额的95%的置信区间。2. 利用下面的信息,构建总体均值的置信区间。(1)总体服从正态分布,且已知,置信水平为95%。(2)总体不服从正态分布,且已知,置信水平为95%。(3)总体不服从正态分布,未知,置信水平为90%。(4)总体不服从正态分布,未知,置信水平为99%。3. 某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时);3
14、.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。4. 某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。重置随机抽取了50户,其中有32户赞成,18户反对。(1)求总体中赞成新措施的户数比例的置信区间,置信水平为95%。(2)如果小区管理者预计赞成的比例能达到80%,要求估计误差不超过10%。应抽取多少户进行调查?5. 顾客
15、到银行办理业务时往往需要等待一些时间,而等待时间的长短与很多因素有关,比如,银行的业务员办理业务的速度、顾客等待排队的方式,等等。为此,某银行准备采取两种排队方式进行试验。第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:方式16.56.66,76.87.17.37.47.77.77.7方式24.25.45.86.26.77.77.78.59.310.0(1)构建第一种排队方式等待时间标准差的95%的置信区间。(2)构建第二种排队方式
16、等待时间标准差的95%的置信区间。(3)根据(1)和(2)的结果,你认为哪种排队方式更好?6. 两个正态总体的方差和未知但相等。从两个总体中分别抽取两个独立的随机样本,它们的均值和标准差如下:来自总体1的样本来自总体2的样本 求的置信区间,显著性水平分别为95%和99%。7. 一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得到的自信心测试分数如下:人员编号12345678910方法178637289914968768555方法271446184745155607739构建两种方法平均自信心得分之差的95%的置信区间。8. 从两个总体中各抽取一个的独立随机样本,来自总
17、体1的样本比例为,来自总体2的样本比例为。 构造的置信区间,置信水平分别为90%和95%。9. 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进以减小方差。下表是两部机器生产的袋茶重量(单位:克)的数据:机器1机器23.453.223.903.223.283.353.202.983.703.283.193.303.223.753.283.303.203.053.503.383.353.303.293.332.953.453.203.343.353.273.163.483.123.283.163.283.203.183.253.303.343.25 构造两个总体方差比的9
18、5%的置信区间。10. 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求估计误差不超过20元,应抽取多少个顾客作为样本?11. 假定两个总体的标准差分别为:,若要求估计误差不超过5,相应的置信水平为95%,假定,估计两个总体均值之差时所需的样本量为多大?12. 假定,估计误差为0.05,相应的置信水平为95%,估计两个总体比例之差时所需的样本量为多大?第五章课后习题参考答案1.解:(1)已知,故:;(2)由题目可知:,故查表可知:估计误差;(3)由题目可知:,由置信区间公式可得: 即快餐店所有
19、顾客午餐平均花费金额的95%的置信区间为(115.8,124.2)元。2.解:(1)总体服从正态分布,则的95%置信区间为:(2)总体不服从正态分布,且样本属于大样本,则的95%置信区间为:(3)总体不服从正态分布,未知,因此使用样本方差代替总体方差,则的90%置信区间为:(4)总体不服从正态分布,未知,因此使用样本方差代替总体方差, ,则的95%置信区间为:3.解:整理数据可以得到,由于属于大样本,所以使用正态分布来构建置信区间。当,该校大学生平均上网时间的90%置信区间为:小时当,该校大学生平均上网时间的95%置信区间为:小时当,该校大学生平均上网时间的95%置信区间为:小时4.解:(1)
20、由题目可知:,由于抽取的样本属于大样本,所以,总体中赞成新措施的户数比例的95%置信区间为:(2)由题目可知:估计误差,得到:即样本个数至少为62户。或直接将带入n确定的公式,即,5.解:(1)整理数据可以得到:,由于抽取的样本属于小样本,所以由CHIINV函数得:,由此可以得到第一种排队方式等待时间标准差的95%的置信区间为:(2)整理数据可以得到:,第二种排队方式等待时间标准差的95%的置信区间为:(3)比较两种方法的标准差置信区间,第一种方法的置信区间更小,说明第一种方法等待时间的离散程度更小,比第二种方式好。6.解:由题目可以得到:当 ,的95%置信区间为:当,的95%置信区间为:7.
21、解:由样本数据计算得到:,则自信心得分之差的95%的置信区间为:8.解:由题目可以得到:, 当,的90%置信区间为:当,的95%置信区间为:9.解:由题目可以得到:,两个总体方差比的95%的置信区间为: 10.解:由题目可以得到:使用过去经验数据,则可以认为 已知,即,在95%置信度下,估计误差,因此:即样本个数至少为139个。11.解:由题目可以得到:总体 已知,即,在95%置信度下,估计误差,因此: 即两个总体的样本各至少为57个。第六章、练习题及解答1. 一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。据报道,10年前每天每个家庭看电视的
22、平均时间是6.70小时。取显著性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?2. 为监测空气质量,某城市环保部门每隔几周即对空气烟尘质量进行一次随机测试。已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值(单位:微克)如下:81.686.680.085.878.658.368.773.296.674.983.066.668.670.971.171.677.376.192.272.461.775.685.572.574.082.587.073.288.586.994.983.0 根据最近的测量数据,当显著性水平时,
23、能否认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值?3. 安装在一种联合收割机上的金属板的平均重量为25公斤。对某企业生产的20块金属板进行测量,得到的重量(单位:公斤)数据如下:22.627.026.225.822.226.625.330.423.228.123.128.627.426.924.223.524.524.926.123.6 假设金属板的重量服从正态分布,在显著性水平下,检验该企业生产的金属板是否符合要求。4. 对消费者的一项调查表明,17的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商从该城市随机抽取550人,调查知其中
24、115人早餐饮用牛奶。在显著性水平下,检验该生产商的说法是否属实。5. 某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:操作A操作B分钟分钟分钟分钟 在的显著性水平下检验平均装配时间之差是否等于5分钟。6. 某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为010分,分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。对的显著性水平,用下列数据检验该假设,并对该广告给予评价。个体购买力
25、得分个体购买力得分看后看前看后看前1655352646983777754438667. 某企业为比较两种方法对员工进行培训的效果,采用方法1对15名员工进行培训,采用方法2对12名员工进行培训。培训后的测试分数如下:方法1方法2565145595753475243525665425352535553504248546457474444 两种方法培训得分的总体方差未知且不相等。在的显著性水平下,检验两种方法的培训效果是否有显著差异。8. 为研究小企业经理是否认为他们获得了成功,在随机抽取的100个小企业的女性经理中,认为自己成功的人数为24人;而在对95个男性经理的调查中,认为自己成功的人数为3
26、9人。在的显著性水平下,检验男女经理认为自己成功的人数比例是否有显著差异。9. 为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:旧肥料新肥料10910197981001051091101181099898949910411311111199112103881081021061061179910711997105102104101110111103110119取显著性水平,检验:(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为:两种肥料产量的方差未知但相等,即。两种肥料产量的方差未知且不
27、相等,即。 (2)两种肥料产量的方差是否有显著差异?10. 生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减小工序方差的途径来改进工序。某杂志上刊载了关于两部机器生产的袋茶重量(单位:克)的数据如下,检验这两部机器生产的袋茶重量的方差是否存在显著差异。()机器12.953.453.503.753.483.263.333.203.163.203.223.383.903.363.253.283.203.222.983.453.703.343.183.353.12机器23.223.303.343.283.293.253.303.273.383.343.353.193.35
28、3.053.363.283.303.283.303.203.163.33第六章课后习题参考答案1.解:由题目可以得到:,; 提出原假设与备择假设:,; 该检验属于右侧单边检验,因此得到拒绝域为:; 在大样本条件下检验统计量为:,落入拒绝域中,因此拒绝原假设,认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。 (或利用Excel的“1-NORMSDIST(3.1113)”函数得到检验P=0.00090.01,则拒绝原假设)2.解:由题目可以得到:,根据样本数据计算得到:,; 提出原假设与备择假设:,; 该检验属于左侧单边检验,因此得到拒绝域为:;在大样本且总体方差未知条件下检验统计量为:
29、,落入拒绝域中,因此拒绝原假设,认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值。 (或利用Excel的“NORMSDIST(-2.3949)”函数得到检验P=0.00830.05,则不能拒绝原假设)4.解:由题目可以得到:,计算样本数据得到; 提出原假设与备择假设:,; 该检验属于右侧单边检验,因此得到拒绝域为:;在大样本条件下检验统计量为:,落入拒绝域中,因此拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17%。 (或利用“1-NORMSDIST(2.4412)”函数得到检验P=0.00730.05,则拒绝原假设)5.解:提出原假设与备择假设:,;在大样本条件下检验
30、统计量为:利用“2*(1-NORMSDIST(5.1450)”函数,得到双尾值为,由于,拒绝原假设,认为两种装配操作的平均装配时间之差不等于5分钟。6.解:设:“看后”平均得分为 ,“看前”平均得分,“看后”平均得分与“看前”平均得分之差为; 提出原假设与备择假设:,; 根据样本数据计算得到:,;在配对的小样本条件下检验统计量为:利用Excel “=TDIST(1.3572, 7, 1)”得到的单尾概率值为0.10842,由于,不能拒绝原假设,没有证据表明广告提高了平均潜在购买力得分。7.解:设:方法一培训测试平均得分为,方法二培训测试平均得分为; 提出原假设与备择假设:,;根据样本数据计算得
31、到:,由于小样本情况下总体方差未知且不相等,t分布自由度为:在小样本条件下检验统计量为:利用Excel的“=TDIST(5.2183, 24, 2)”函数,得到的双尾概率值为0.00002,由于,拒绝原假设,认为两种培训方法的效果存在显著差异。8.解: 设:男性经理认为自己成功的人数比例为 , 女性经理认为自己成功的人数比例为,两个样本合并后得到的合并比例为; 提出原假设与备择假设:,;根据样本数据计算得到:两个样本的比例分别为:41,24两个样本合并后得到的合并比例;检验统计量为:利用Excel的“=2*(1-NORMSDIST(2.5373)”函数,得到检验概率值为0.0112,由于,所以
32、拒绝原假设,认为男女经理认为自己成功的人数比例具有显著差异。9.解:设:新肥料获得的平均产量为,旧肥料获得的平均产量为;(1)两种肥料产量的方差未知但相等,即时:提出原假设和备择假设: ; 根据样本数据计算得:, ,; 总体方差的合并估计量为: 检验统计量为: 利用Excel的“=TDIST(5.4271, 38, 1)”函数,得到单尾概率值为0.000002,由于,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。(以上也可由Excel中的t-检验:双样本等方差假设给出)两种肥料产量的方差未知且不相等,即时: 提出原假设与备择假设:;根据样本数据计算得到:, ,由于小样本情况下总体方差未
33、知且不相等,t分布自由度为:在小样本条件下检验统计量为:利用Excel的“=TDIST(5.4271, 37, 1)”函数,得到单尾概率值为0.000002,由于,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。(以上也可由Excel中的t-检验:双样本异方差假设给出)(2)设:使用新肥料的田地为样本1,使用旧肥料的田地为样本1 提出原假设与备择假设:;利用Excel中的“-检验:双样本方差”()得到的检验结果如下表所示:F-检验 双样本方差分析变量 1变量 2平均109.9100.7方差33.3578924.11579观测值2020df1919F1.383239P(F=f) 单尾0.2
34、4311F 单尾临界2.526451由于,不能拒绝原假设,没有证据表明两种肥料产量的方差有显著差异。10.解:设:机器一为样本1,机器二为样本1 提出原假设与备择假设:; 利用Excel的“-检验:双样本方差”()得到的检验结果如下表所示:F-检验 双样本方差分析变量 1变量 2平均3.32843.278181818方差0.0488890.005901299观测值2522df2421F8.284447623P(F=f) 单尾3.61079E-06F 单尾临界2.367525575由于,拒绝原假设,认为两种肥料产量的方差有显著差异。第七章、练习题及解答1.从某市的三个小学中分别抽若干名5年级男生
35、,测量其身高,数据如下,小学身高(cm)大成小学平明小学师范附小128 135 148 152 146 135 148145 156 162 157 136145 136 139 148 164 142试检验不同小学5年级男生身高有无显著差别(a =0.05)解:设三个小学的5年级男生的平均身高分别为。提出假设: 不全相等 由Excel输出的方差分析表如下:差异源SSdfMSFP-valueF crit组间262.43812131.2191.3885010.2797343.68232组内1417.5621594.50413总计168017P-value=0.279734a =0.05,(或者F
36、=1.388501F crit=3.68232),不能拒绝原假设,没有证据表明该市3所小学5年级的男生身高有显著差异。2.某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)数据见下表:试验号电池生产企业ABC15032452502842343303844034485392640试分析三个企业生产的电池的平均寿命之间有无显著差异?如果有差异,用LSD方法检验哪些企业之间有差异? (a =0.05)解:A、B、C三个企业生产的电池的平均寿命分别为。提出假设: 不全相等由Excel输出的方差分析表
37、如下:方差分析差异源SSdfMSFP-valueF crit组间615.62307.817.068390.000313.885294组内216.41218.03333总计83214P-value=0.00031a =0.05(或F=17.06839F crit=3.885294),拒绝原假设。表明电池的平均寿命之间有显著差异。为判断哪两家企业生产的电池平均寿命之间有显著差异,首先提出如下加红色:检验1:检验2:检验3:然后计算检验统计量:计算LSD。根据方差分析表可知,MSE=18.03333.根据自由度=n-k=15-3=12.查t分布表得计算的LSD如下:作出决策。LSD=5.85,拒绝原
38、假设。企业A与企业B电池的平均使用寿命之间有显著差异。LSD=5.85,不拒绝原假设。没有证据表明企业A与企业C电池的平均使用寿命之间有显著差异。LSD=5.85,拒绝原假设。企业B与企业C电池的平均使用寿命之间有显著差异。3.某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,平均分为三组,并指定每组使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果。差异源SSdfMSFP-valueF crit组间(420)(2)210(1.478)0.2459463.354131组内3836(27)(142.07)-合计(4256)29-要求:(1)完成上面的方差分析表。(2)检验三种方法组装的产品数量之间是否有显著差异? (a=0.05)解:(1)差异源SSdfMSFP-valueF crit组间(420)(2)210(1.478)0