《统计学第五版课后题答案(共77页).doc》由会员分享,可在线阅读,更多相关《统计学第五版课后题答案(共77页).doc(77页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上统计学第五版贾俊平版课后题答案(部分)第三章 数据的图表展示31 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A好;B较好;C一般;D较差;E.差。调查结果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACEEABDDCADBCCAEDCBCBCEDBCCBC 要求:(1)指出上面的数据属于什么类型。 顺序数据(2)用Excel制作一张频数分布表。 用数据分析直方图制作:接收频率E16D17C32B21A14 (3)
2、绘制一张条形图,反映评价等级的分布。 用数据分析直方图制作:(4)绘制评价等级的帕累托图。逆序排序后,制作累计频数分布表:接收频数频率(%)累计频率(%)C323232B212153D171770E161686A141410032 某行业管理局所属40个企业2002年的产品销售收入数据如下:1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累
3、积频率。1、确定组数: ,取k=62、确定组距: 组距( 最大值 - 最小值) 组数=(152-87)6=10.83,取103、分组频数表销售收入频数频率%累计频数累计频率%80.00 - 89.0025.025.090.00 - 99.0037.5512.5100.00 - 109.00922.51435.0110.00 - 119.001230.02665.0120.00 - 129.00717.53382.5130.00 - 139.00410.03792.5140.00 - 149.0025.03997.5150.00+12.540100.0总和40100.0(2)按规定,销售收入在1
4、25万元以上为先进企业,115125万元为良好企业,105115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。频数频率%累计频数累计频率%先进企业1025.01025.0良好企业1230.02255.0一般企业922.53177.5落后企业922.540100.0总和40100.033 某百货公司连续40天的商品销售额如下: 单位:万元41252947383430384340463645373736454333443528463430374426384442363737493942323635 要求:根据上面的数据进行适当的分组,编制频数分布表,
5、并绘制直方图。1、确定组数: ,取k=62、确定组距: 组距( 最大值 - 最小值) 组数=(49-25)6=4,取53、分组频数表销售收入(万元)频数频率%累计频数累计频率%= 2512.512.526 - 30512.5615.031 - 35615.01230.036 - 401435.02665.041 - 451025.03690.046+410.040100.0总和40100.034 利用下面的数据构建茎叶图和箱线图。572929363123472328283551391846182650293321464152282143194220data Stem-and-Leaf Plot
6、 Frequency Stem & Leaf 3.00 1 . 889 5.00 2 . 01133 7.00 2 . 2.00 3 . 13 3.00 3 . 569 3.00 4 . 123 3.00 4 . 667 3.00 5 . 012 1.00 5 . 7 Stem width: 10 Each leaf: 1 case(s)36一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下: 单位:g574649545558496151495160525451556056474753514853505
7、24045575352514648475347534447505253474548545248464952595350435346574949445752424943474648515945454652554749505447484457475358524855535749565657534148要求:(1)构建这些数据的频数分布表。(2)绘制频数分布的直方图。(3)说明数据分布的特征。解:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。1、确定组数: ,取k=6或72、确定组距: 组距( 最大值 - 最小值) 组数=(61-40)6=3.5,取3或者4、5 组
8、距( 最大值 - 最小值) 组数=(61-40)7=3,3、分组频数表组距3,上限为小于 频数百分比累计频数累积百分比有效40.00 - 42.0033.033.043.00 - 45.0099.01212.046.00 - 48.002424.03636.049.00 - 51.001919.05555.052.00 - 54.002424.07979.055.00 - 57.001414.09393.058.00+77.0100100.0合计100100.0直方图:组距4,上限为小于等于 频数百分比累计频数累积百分比有效= 40.0011.011.041.00 - 44.0077.088.
9、045.00 - 48.002828.03636.049.00 - 52.002828.06464.053.00 - 56.002222.08686.057.00 - 60.001313.09999.061.00+11.0100100.0合计100100.0直方图:组距5,上限为小于等于 频数百分比累计频数累积百分比有效1, 则k+1, k-1令P(x=k+1)/P(x=k)1, 则-1若2, 则P(x=1)P(x=-1)P(x=-1+2), k=-1+1=是最大综上, 2时,k=(写成分段的形式,是取整符号)5.16 (1)0.6997 (2)0.55.17 173.9135.18 (1)0
10、.9332 (2)0.383第六章 统计量及其抽样分布6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差盎司的正态分布。随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过0.3盎司的概率。解:总体方差知道的情况下,均值的抽样分布服从的正态分布,由正态分布,标准化得到标准正态分布:z=,因此,样本均值不超过总体均值的概率P为:=2-1,查标准正态分布表得=0.8159因此,=0.63186.2 =0.95 查表得: 因此n=436.3 ,表示从标准正态总体中随机抽取的容量,n=6的一个样本,试
11、确定常数b,使得解:由于卡方分布是由标准正态分布的平方和构成的:设Z1,Z2,Zn是来自总体N(0,1)的样本,则统计量服从自由度为n的2分布,记为2 2(n)因此,令,则,那么由概率,可知:b=,查概率表得:b=12.596.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差的标准正态分布。假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差,确定一个合适的范围使得有较大的概率保证S2落入其中是有用的,试求b1,b2,使得解:更加样本方差的抽样分布知识可知,样本统计量: 此处,n=10,所以统计量根据卡方分布的可知:又因为:因
12、此:则:查概率表:=3.325,=19.919,则=0.369,=1.88第7章 参数估计7.1(1)已知:,。样本均值的抽样标准差。(2)估计误差。7.2(1)已知:,。样本均值的抽样标准差。(2)估计误差。(3)由于总体标准差已知,所以总体均值的95%的置信区间为:,即(115.8,124.2)。7.3已知:,。由于总体标准差已知,所以总体均值的95%的置信区间为:,即(87818.856,.144)。7.4(1)已知:,。由于为大样本,所以总体均值的90%的置信区间为:,即(79.026,82.974)。(2)已知:,。由于为大样本,所以总体均值的95%的置信区间为:,即(78.648,
13、83.352)。(3)已知:,。由于为大样本,所以总体均值的99%的置信区间为:,即(77.940,84.096)。7.5(1)已知:,。由于总体标准差已知,所以总体均值的95%的置信区间为:,即(24.11,25.89)。(2)已知:,。由于为大样本,所以总体均值的98%的置信区间为:,即(113.17,126.03)。(3)已知:,。由于为大样本,所以总体均值的90%的置信区间为:,即(3.136,3.702)。7.6(1)已知:总体服从正态分布,。由于总体服从正态分布,所以总体均值的95%的置信区间为:,即(8646.97,9153.03)。(2)已知:总体不服从正态分布, ,。虽然总体
14、不服从正态分布,但由于为大样本,所以总体均值的95%的置信区间为:,即(8734.35,9065.65)。(3)已知:总体不服从正态分布,未知,。虽然总体不服从正态分布,但由于为大样本,所以总体均值的90%的置信区间为:,即(8760.97,9039.03)。(4)已知:总体不服从正态分布,未知,。虽然总体不服从正态分布,但由于为大样本,所以总体均值的99%的置信区间为:,即(8681.95,9118.05)。7.7已知:,当为0.1、0.05、0.01时,相应的、。根据样本数据计算得:,。由于为大样本,所以平均上网时间的90%的置信区间为:,即(2.88,3.76)。平均上网时间的95%的置
15、信区间为:,即(2.79,3.85)。平均上网时间的99%的置信区间为:,即(2.63,4.01)。7.8已知:总体服从正态分布,但未知,为小样本,。根据样本数据计算得:,。总体均值的95%的置信区间为:,即(7.11,12.89)。7.9已知:总体服从正态分布,但未知,为小样本,。根据样本数据计算得:,。从家里到单位平均距离的95%的置信区间为:,即(7.18,11.57)。7.10(1)已知: ,。由于为大样本,所以零件平均长度的95%的置信区间为:,即(148.87,150.13)。(2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为、方差为的总体中,抽取容量为的随机样
16、本,当充分大时(通常要求),样本均值的抽样分布近似服从均值为、方差为的正态分布。7.11(1)已知:总体服从正态分布,但未知,为大样本,。根据样本数据计算得:,。该种食品平均重量的95%的置信区间为:,即(100.87,101.77)。(2)根据样本数据可知,样本合格率为。该种食品合格率的95%的置信区间为:,即(0.82,0.98)。7.12已知:总体服从正态分布,但未知,为小样本,。根据样本数据计算得:,。总体均值的99%的置信区间为:,即(15.64,16.62)。7.13已知:总体服从正态分布,但未知,为小样本,。根据样本数据计算得:,。网络公司员工平均每周加班时间的90%的置信区间为
17、:,即(10.36,16.76)。7.14(1)已知:,。总体总比例的99%的置信区间为:,即(0.32,0.70);(2)已知:,。总体总比例的95%的置信区间为:,即(0.78,0.86);(3)已知:,。总体总比例的90%的置信区间为:,即(0.46,0.50)。7.15已知:,为0.1和0.05时,相应的,。总体总比例的90%的置信区间为:,即(0.18,0.28)。总体总比例的95%的置信区间为:,即(0.17,0.29)。7.16已知:,估计误差,。应抽取的样本量为:。7.17(1)已知:,。应抽取的样本量为:。(2)已知:,未知,。由于未知,可用使用0.5。应抽取的样本量为:。(
18、3)已知:,。应抽取的样本量为:。7.18(1)已知:,。总体中赞成该项改革的户数比例的95%的置信区间为:,即(0.51,0.77)。(2)已知:,。应抽取的样本量为:。720 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:方式16.56.66.76.87.17
19、.37.47.77.77.7方式24.25.45.86.26.77.77.78.59.310 要求:(1)构建第一种排队方式等待时间标准差的95的置信区间。解:估计统计量:经计算得样本标准差=3.318,=0.95,n=10,=19.02,=2.7置信区间:=(0.1075,0.7574)因此,标准差的置信区间为(0.3279,0.8703)(2)构建第二种排队方式等待时间标准差的95的置信区间。解:估计统计量:经计算得样本标准差=0.2272,=0.95,n=10,=19.02,=2.7置信区间:=(1.57,11.06)因此,标准差的置信区间为(1.25,3.33)(3)根据(1)和(2)
20、的结果,你认为哪种排队方式更好? 第一种方式好,标准差小。7.21 正态总体,独立小样本,方差未知但相等:(其中,) (1)=1.7291,代入略(2)=2.0930,代入略(3)=2.8609,代入略7.22 (1)正态或非正态总体,独立大样本,方差未知(2)正态总体,独立小样本,方差未知但:(其中,)(3)正态总体,独立小样本,方差未知但,(4)正态总体,独立小样本,方差未知但,:(其中,)(5)正态总体,独立小样本,方差未知但, (其中)723 下表是由4对观察值组成的随机样本。配对号来自总体A的样本来自总体B的样本1234251080765(1)计算A与B各对观察值之差,再利用得出的差
21、值计算和。 =1.75,=2.62996(2)设分别为总体A和总体B的均值,构造的95的置信区间。解:小样本,配对样本,总体方差未知,用t统计量均值=1.75,样本标准差s=2.62996,=0.95,n=4,=3.182置信区间:=(-2.43,5.93)7.24小样本,配对样本,总体方差未知:=2.2622=(6.3272,15.6728)725 从两个总体中各抽取一个250的独立随机样本,来自总体1的样本比例为40,来自总体2的样本比例为30。要求:(1)构造的90的置信区间。(2)构造的95的置信区间。解:总体比率差的估计大样本,总体方差未知,用z统计量:样本比率p1=0.4,p2=0
22、.3,置信区间:=0.90,=1.645=(3.02%,16.98%)=0.95,=1.96=(1.68%,18.32%)7.26 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对序进行改进以减小方差。下面是两部机器生产的袋茶重量(单位:g)的数据:机器1机器23.453.223.93.223.283.353.22.983.73.383.193.33.223.753.283.33.23.053.53.383.353.33.293.332.953.453.23.343.353.273.163.483.123.283.163.283.23.183.253.33.343.25要求:构造两
23、个总体方差比/的95的置信区间。解:统计量:置信区间:=0.058,=0.006,n1=n2=21,=0.95,=2.4645,=0.4058=(4.05,24.6)727 根据以往的生产数据,某种产品的废品率为2。如果要求95的置信区间,若要求估计误差(边际误差)不超过4,应抽取多大的样本?解:, =0.95,=1.96=47.06,取n=48或者50。728 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本?解:,=0.95,=1.96, =13
24、8.3,取n=139或者140,或者150。第八章 假设检验1 已知某炼铁厂的含碳量服从正态分布N(4.55,0.108),现在测定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55(=0.05)?解: 已知0=4.55,=0.108,N=9,=4.484,这里采用双侧检验,小样本,已知,使用Z统计。假定现在生产的铁水平均含碳量与以前无显著差异。则,H0 : =4.55 ; H1 : 4.55=0.05,/2 =0.025 ,查表得临界值为1.960nxZ/s-= 计算检验统计量: = (4.484-4.55)/(0.108/9) = -1.
25、833 决策:Z值落入接受域,在a=0.05的显著性水平上接受H0。结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为4.55。2 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,=60小时,试在显著性水平0.05下确定这批元件是否合格。解: 已知N=36,=60,=680,0 =700 这里是大样本,已知,左侧检验,采用Z统计量计算。 提出假设:假定使用寿命平均不低于700小时 H0:700 H1: 700a = 0.05,左检验临界值为负,查得临界值: -Z0.05=-1.645计算检验统计量:0nxZ/s-=