《2015年统计学(第五版)贾俊平等著课后习题答案 (一).pdf》由会员分享,可在线阅读,更多相关《2015年统计学(第五版)贾俊平等著课后习题答案 (一).pdf(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第 一 章 导论1.1(1)数值型变量。(2)分类变量。(3)离散型变量。(4)顺序变量。(5)分类变量。1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2 0 0 0 个职工家庭的集合。(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2 0 0 0 个职工家庭的年人均收入。1.3(1)总体是所有I T 从业者的集合。(2)数值型变量。(3)分类变量。(4)截面数据。1.4(1)总体是所有在网上购物的消费者的集合。(2)分类变量。(3)参数是所有在网上购物者的月平均花费。(4)参数(5)推断统计方法。第二章数据的搜集1 .什么是二手资料?使用二手资料需要注意些什么?与研究内容有关
2、的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。2 .比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量
3、特征,得到总体参数的置信区间,就使用概率抽样。非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。4.自填式、面方式、电话式调查个有什么利弊?自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答
4、敏感问题的压力。缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员的作用。缺点:成本比较高,对调查过程的质量控制有一定难度。对于敏感问题,被访者会有压力。电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。5.请 举 出(或设计)几个实验数据的例子。不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。6.你认为应当如何控制调查中的回答误差?对于理解误差,要注意表述中的措辞,学习一定的
5、心里学知识。对于记忆误差,尽量缩短所涉及问题的时间范围。对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。7.怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。对于随机误差,可以通过增加样本容量来控制。对于系统误差,做好预防,在调查前做好各方面的准备工作,尽量把无回答率降到最低程度。无回答出现后,分析武回答产生的原因,采取补救措施。比如要收回一百份,就要做好一百二十份或一百三十份问卷的准备,当被调查者不愿意回答时,可以通过一定的方法劝服被访者,还可以通过馈赠小礼品等的方式提高回收率。第三章 数据的图表搜集一、思考
6、题3.1数据的预处理包括哪些内容?答:审核、筛选、排序等。3.2分类数据和顺序数据的整理和显示方法各有哪些?答:分类数据在整理时候先列出所分的类别,计算各组的频数、频率,得到频数分布表,如果是两个或两个以上变量可以制作交叉表。对于分类数据可以绘制条形图、帕累托图、饼图、环形图等。根据不同的资料或者目的选择不同的图。对于顺序数据,可以计算各种的频数、频率,以及累计频数、累计频率。可根据需要绘制条形图、饼图、环形图等。3.3数值型数据的分组方法有哪些?简述组距分组的步骤。答:单变量值分组和组距分组。其中组距分组:第一步,确定组数,组数多少由数据的多少和特点等决定,一般5 1 5 组;第二步,确定各
7、组组距,宜取5 或 1 0 的倍数;第三步,根据分组整理出频数分布表,注意遵循“不重不漏”和“上限不在内”的原则。3.4直方图和条形图有何区别?答:1,条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度与宽度都有意义;2直方图各矩形连续排列,条形图分开排列;3条形图主要展示分类数据,直方图主要展示数值型数据。3.5 绘制线图应注意问题?答:时间在横轴,观测值绘在纵轴。般是长宽比例1 0:7的长方形,纵轴下端般从0开始,数据与0 距离过大的话用折断符号折断。3.6 饼图和环形图的不同?答:饼图只能显示一个样本或总体
8、各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。3.7 茎叶图比直方图的优势,他们各自的应用场合?答:茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。3.8鉴别图标优劣的准则?答:P 6 5 明确有答案,我就不写了。3.9制作统计表应注意的问题?答:1,合理安排统计表结构;2表头一般包括表号,总标题和表中数据的单位等内容;3 表中的上下两条横线一般用粗线,中间的其他用细线,两端开口,数字右对齐,不要有空白格;4在使用统计表时,必要时
9、可在下方加注释,注明数据来源。二、练习题3.1 答:(1)表中数据属于顺序数据。(2)用 E x c el 制作一张频数分布表。服务等级家庭数目(个)好1 4较好2 1一 般32较差18差15(3)绘制一张条形图,反映评价等级的分布。(4)绘制评价等级的帕累托图。售后服务等级的帕累托图3.2某行业管理局所属40个企业2002年的产品销售收入数据如下:1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根据上
10、面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。1、确定组数:K=1 +年 丝:l g(2)一+嗡1,嚼8 2,殖2、确定组距:组距=(最 大 值-最 小 值)+组 数=(152-87)+6=10.83,取 103、分组频数表销售收入频数频率%向上累计频数向上累计频率%80-90252590-10037.5512.5100-110922.51435110-12012302665120-130717.53382.5130-1404103792.5140-15025.03997.5150以上12.540100合计40100.0(2)按规定,销售收入在125万元以上为先进企业,1
11、15125万元为良好企 忆105115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。频数频率向上累计频数向上累计频率先进企业10251025良好企业12302255一般企业922.53177.5落后企业922.540100合计40100一3.3某百货公司连续40天的商品销售额如下:单位:万元41252947383430384340463645373736454333443528463430374426384442363737493942323635要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。答:1、确定组数:lg()igC27
12、K=1+lg(40)i 1.60206-=1 H-lg2 0.30103=6.32,取 k=62、确定组距:组距=(最 大 值-最小值)小 组数=(49-25)+6=4,取 53、分组频数表(根据实际资料,调整成分5 个组)4、直方图销售收入(万元)频数频率向上累计频数向上累计频率3 0 以下41041030-35615102535-401537.52562.540-45922.534854 5 以上61540100合计40100.0一频率(天)151050匚二!频率1 5 0-0%T-累积100.00%50.00%0.00%30 以下 30-35 35-40 40-45 45 以上销售额(万
13、元)商店40天销售额的直方图3.4利用下面的数据构建茎叶图和箱线图。572929363123472328283551391846182650293321464152282143194220答:茎叶图F r eq u enc yS t em&L eaf3.0 01.8 8 95.0 02.0 1 1 3 37.0 02 .6 8 8 8 9 9 92.0 03 .1 33.0 03 .5 6 93.0 04 .1 2 33.0 04 .6 6 73.0 05 .0 1 21.0 05 .7箱线图3.5答:频数分布表灯泡寿命频率向上累积频率()660以下22%660-67057%670-68061
14、3%680-6901427%690-7002653%700-7101871%710-7201384%720-7301094%730-740397%740以上3100%合计100一直方图从直方图看,数据的分布呈左偏分布。3.6答:频数分布表K_ i+lg()T+lgO )7+2l g(2)l g 20.3 0 1 0 3=6.6 4 ,取k=72、确定组距:组距=(最 大 值-最小值)+组数=(6 1-4 0)+7=3,取 33、分组频数表(根据实际资料,调整成分5 个组)食品重量(g)频数频率向上累计频数向上累计频率4 3 以下33434 3 -4 6991 21 24 6 -4 92 42
15、43 63 64 9 -5 21 91 95 55 55 2 -5 52 42 47 97 95 5 -5 81 41 49 39 358以上771 0 01 0 0合计1 0 01 0 0.0一从直方图看,数据的分布呈双峰分布。3.7 频数分布表重量误差(g)频数频率向上累计频数向上累计频率1 9-2 951 051 02 9-3 971 41 22 43 9-4 981 62 04 04 9-5 91 32 63 36 65 9-6 991 84 28 46 9-7 961 24 89 67 9-8 9245 01 0 0合计5 01 0 0一从直方图看,数据的分布呈左偏分布3.8(1)数
16、值型数据(2)频数分布表取 k=72、确定组距:组距=(最 大 值-最 小 值):组 数=(9+2 5)+7=4.8 6,取 5气 温()频数频率%向上累计频数向上累计频率(-2 5,-2 0)61 0.0 061 0.0 0(-2 0,-1 5)81 3.3 31 42 3.3 3(-1 5,-1 0)1 01 6.6 7244 0.0 0(-1 0.-5)1 32 1.6 73 76 1.6 7(-5.0)1 22 0.0 04 98 1.6 7(0,5)46.6 75 38 8.3 3(5,1 0)71 1.6 76 01 0 0.0 0合计6 01 0 0一一从直方图看,数据的分布呈左
17、偏分布。3.9年龄分布直方图自学考试人员年龄分布集中在20-24之间,分布图呈右偏。3.103.11散 点 图3.1 2 (1)复式条形图SF形 图(2)甲班成绩分布图近似正态分布,分布较均衡;乙班成绩分布图右偏。(3)根据雷达图,两班成绩分布不相似。313三箔!N咨-z-勺4二7-二士二-。Xill二trMWEF?。*3.14进 口 :销 挚名国 内 生 产 总 值第一、.、三 产 业 国 内外:产总值。第:产业T-第一产业第:产业第四章习题答案4.1 数据排列:2,4,7,1 0,1 0,1 0,1 2,1 2,1 4,1 5(1)众数:1 0:中位数:1 0平均数:9.6(2)四分位数:
18、Q,位置=学=2.5.所以Q 二1=5.5Q u 位置=乎=7.5,所 以 久,=号=1 3(3)标准差:4.1 7(4)峰度一0.2 5,偏 度-0.6 94.2(1)众数:1 9;2 3中位数:2 3平均数:2 4(2)四分位数:Q,位置=争=6.2 5.所以Q 3 1 9+0.2 5 =1 9Q u 位置=普=电 75,所以 Q y=2 5+2*0.75=2 6.5(3)标准差:6.6 5(4)峰度0.77,偏 度 1.0 84.3(1)茎叶图略(2)平 均 数:1,标准差0.71(3)第一种方式 的 离 散 系 数 vs=-=空=0.2 8x 7.2第二种方式的离散系数 匕=2 2 1
19、=0.1 0 x 7所以,第二种排队方式等待时间更集中。(4)选择第二种,因为平均等待的时间短,而且等待时间的集中程度高4.4(1)平 均 数:2 74.1,中位数:2 72.5(2)Q,位置=乎=7.5.所以 Q 2 5 8+0.2 5-3=2 5 8.75Q u 位置=乎=2 2.5,所以 Q u=2 84+7.0.75=2 89.2 5(3)”销售额的标准差:2 1.1 74.5.产品名称单位成本(元)总成本/元产量甲企业乙企业甲企业乙企业A1 52 1 0 03 2 5 51 402 1 7B2 03 0 0 01 5 0 01 5 075C3 01 5 0 01 5 0 05 05
20、0合计6 6 0 06 2 5 53 403 42甲企业总平均成本5 =上-=磔=1 9.41 (元)n 3 40乙 企 业 总 平 均 成 本 六 江二些=18.29(元)n 342所 以 甲 企 业 的 总 平 均 成 本 比 乙 企 业 的 高,原 因 是 甲 企 业 高 成 本 的 产 品 B 生产的产量 比 乙 企 业 多,所 以 把 总 平 均 成 本 提 高 了。4.6 计 算 数 据 如 表:按利润额分组(万元)组中值企 业 数(个)利润额(一 X )2 y200300250194750593033300-400350301050017634940050045042189002
21、2860500600550189900273785600以上650117150548639合计-120512001614666利润总额的平均数x=g-=上51”200=426.67(万 元)n 120利 润 总 额 标 准 差 产(J,=0 =楞票=1 6 9 9(万 元)(跖 一.峰态系数K=上-05 451087441648 3120 x(115.99)4=2.352-3=0.6479偏态系数SK=k52(叫.-办 X(%426.67)3 力i=l_,=1ns3 120 x(115.99)3=0.20574.7(1)不同。1000名的平均身高较高;(2)不同。100名的样本容量的标准差更大
22、;(3)不同,调 查 1000名的样本容量得到最高和最低者的机会较大。4.8 对于不同的总体的差异程度的比较采用标准差系数,计算如下:上男=*=2=8.3%;v=10%x 60 s x 50(1)女生的体重差异大,因为离散系数大;(2)以磅为单位,男生的平均体重为132.6磅,标准差为11.05磅;女生的平均体重为110.5磅,标准差为11.05磅田 s 1 1.0 5 Q dam-JL.s 1 1.0 5上男=-=8.3 3%匕女=-=1 0%x 1 3 2.6 x 1 1 0.5(3)Z j=1,所以大约有68%的人体重在55kg65kg之间;s 5X x 40 5 0(4)号=也=一=2
23、,所以大约有95%的女生体重在40kg 60kg之间。s 5x,-X4.9号=一1 1 5-1 0 01 5=1 ;X,.-x _ 42 5-40 0由此可以判断第二项测试更理想。4.10可以看出,周一和周六两天生产线失去了控制。时间周一周二周三.周四周五周六周日产量3850367036903720361035903700Z值30.60.20.41.82.204.11(1)采用离散系数,因为如果比较身高差异,儿童和成年人属于不同的总体;(2)匕 成 年s=4.2 01 72.1=2.44%,2.5 07L 3=3.5%s匕儿童=.所以,儿童的身高差异更大。4.12(1)对集中程度和离散程度分别
24、评价,选择集中趋势数值大的,而且离散程度数值小的方式(2)选择方法A,因为A方法下,工人的平均组装数量为165.6,而且该方法下,工人组装数量的离散系数只有0.0 1 2,所以选择A方法。4.13(1)用离散系数(2)商业类(3)高科技第六章统计量与抽样分布1、设 Xp X2,,*是 从 总 体 X 中 抽 取 的 容 量 为 n的一个样本,如果由此样 本 构 造 一 个 函 数 T(X j X2,,Xn),不 依 赖 于 任 何 未 知 参 数,则称函数T(Xp X2,,X”)是一个统计量。由样本构建具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到
25、统计量的取值上,不同的统计推断问题要求构造不同的统计量。构造统计量的主要目的就是对总体的未知参数进行推断,如果统计量中含有总体的未知参数就没办法再对参数进行统计推断。T T2、1 和2是统计量,和4在日和。未 知的情况下不是统计量。3、设Xp X2,,X。是从总体X 中 抽 取 的 一 个 样 本,X称 为 第 i个 次 序 统 计 量,它是样本(X-X2,-,X j 满 足 如 下 条 件 的 函 数:每当样本得到一组观测值X,2,X”时,其由小到大 的 排 序 X X x(i)X(n)中第i个值X(i)就作为次序统计量X 的观测值,而X,X,,X(n)称 为 次 序 统 计 量。4、假若一
26、个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,这样的统计量称充分统计量。5、统计学上的自由度指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的资料的个数。6、犬 分 布 和 正 态 分 布 关 系:n f+8时,分 布 的 极 限 分 布 是 正 态 分 布。t分布和正态分布的关系:t分布的密度函数曲线与标准正态分布的密度函数曲线非常相似,但t(n)分布的密度函数在两侧的尾部都要比标准正态的两侧尾部粗一些,方差也比标准正态分布的方差大。随着自由度n的增加,t分布的密度函数越来越接近标准正态分布的密度函数。F分布和正态分布关系:若X t(n)贝 iJX JR l,n%并
27、且随着自由度的增加,X也越来越接近于标准正态怖,若SX看成近似服从标准正面布的一个随机变量,则X2F(1,n)o7、在重复选取容量为n 的样本时,由样本统计量的所有取值形成的相对频数分布为统计量的抽样分布。8、中心极限定理:设从均值为,方差为/的任意一个总体中抽取样本量为n的样本,当 n充分大时、样本均值大的抽样分布近似服从均值为,方差为之的n正态分布。中心极限定 理解决了在总体为非正 态的情况下,样本平均 数的抽样分布问题,为总体参数 的推断提供了理论基础。二、练习1、易知由这台机器灌装的9 个瓶子形成的样本,其平均灌装量服从正态分布,均值为,标准差为外a _ 1忑=马故(-、低一|0.3)
28、=尸 0.9 =P(j z|0.9)=0.6 3 1 9(L 3 )又知b =l,几=(翳)=4 2.6 8,故=4 3。63、易知ZZ:服从自由度为6的卡方分布,得匕=/s 5 =1 2.5 9 (左侧分位数)i=4、因为(一1 一服从2(“1)分布,我们已知”=1 0,b =l,故9 s2服从/(9)(y分 布,P(b,S2 b)=Pb 9 52 9 Z 2)=0.0 5,P(9 52%,)=0.0 5 ,则 可 以 得 到 9%=ZQ95(9)=1 6.9 2 ,%=/。5 =3.3 3,故 仇=0.3 7也=1.8 8。(题中均为左侧分位数)第 七 章 参 数 估 计7.1 (1)cr
29、v=0.7 94 n V 4 0(2)由于 l-a=9 5%a=5%Za=1.9 62所以 估计误差Z 0早=1.9 6 x 3 a 1.5 53 品 V 4 07.2 (1)(y-T=-,=2.1 44 n V 4 9(2)因为Z a =1.9 6 所以Z a 享=1.9 6 x g =4.2 0I1 AA?A/49(3)口的置信区间为无土 Z a午=1 2 0 4.2 02 V n7.3 由于Z“=1.96 x=104560 cr=85414 n=1002所以U的95%置信区间为于土Z“3cr=104560 1.96x华8541?4=104560 16741.14V1007.4(1)s 1
30、2u 的 90%置信区间为元土Z a J=81L645X =811.97V100v 2(2)口的 95%置信区间为 无 土 与=811.96X-7=812.35y Vn V100v rz(3)口 的 99%置信区间为亍土Z a r=8 1 2.5 8 x-=813.096i Vn V1007.5(1)5土Z“耳=251.96X=250.89y Vn V60s23.89(2)元+Z“T=119.6+2.326 x二7 =119.6+6.416gV75(3)x+Z 3=3.419+1.645xo 974=3.419+0.283V327.6(1)x+Za-=8900+1.96x料=8900+253.
31、035V15(2)亍土Z.隼=89001.96x铠=8900 165.6501 4n V35(3)x Za=8900 1.645x芈=8900 139.028f Vn V35(4)无土=8900 2.326x答=8900 196.583|Vn V357.7 7=3.317n36Z&-5丫 =1.609i=s1 60990%置 信 区 间 为 亍 土2=3.317 1.645 x半=3.317 0.4417369 5%置信区间为亍土Z 下29 9%置信区间为无土 Za2 N3.3 1 7 1.9 6 x B=3.3 1 7 0.5 2 6V 3 63.3 1 7 2.5 7 6 =3.3 1 7
32、 0.6 9 0 8V 3 617.8 x=Vx;=1 0nn-8&初2=3.4 6 41 i=lc 3 4 6 4所以 9 5%置信区间为xta 劣=1 0土2.3 6 4 6 x=1 0 2.8 9 6为 t)品 V87.9 x =1工 七=9.3 7 5 由于 f 乜 必(1 5)=2.1 3 1n耳(-1)s=J=Z-.1 1 3c 4 1 1 3所以 9 5%置信区间为无土 J 丁 =9.3 7 5 2.1 3 1 x =9.3 7 5 2.1 9 1效 t)4 n V 1 6s 1 9 37.1 0 (1)x Z 4=1 4 9.5 1.9 6 x 4=1 4 9.5 0.6 3f
33、 4 n V 3 6(2)中心极限定理7.1 1 (1)x =V x =x 5 0 6 6 =1 0 1.1 3 2n 乙 1 5 0s=J=Z(彳=信 X 1 3 L8 8 =1.6 4 1s I 6 4 1亍 土 Z.7 =1 0 1.3 2 1.9 6 x r一=1 0 1.3 2 0.4 5 5q 4 n V 5 0(2)山于=34 5=0.95 0所以合格率的9 5%置信区间为pzaJ3H3=0.9 1.9 6 X l0-9 x 0-1=0.9 0.0 8 32 V n V 5 07.1 2 由于于=2Zx,=1 6 1 2 8 t 乜,0 0 5(2 4)=3.7 4 5n(T)y
34、(x,.-x)2=0.8 7 0 6一1所以9 9%置信区间为xta(n-21 6 1.2 8 3.7 4 5 x。,誓=16L 28 0.6 5 3V 2 57.1 3 ta(n 1)=0 0 5(1 7)=1.7 3 9 6 7 =1 3.5 5 677.8 0 0 7 Q所以9 0%置信区间为无土%(1)十 =1 3.5 5 6 1.7 3 9 6 乂 推 =1 3.5 5 6 3.1 9 87.1 4 (1)鹏严35 7 6,2笋=0.5 1 0.1 9 4土2/=0-8 2 1 爪|=。.8 2。.。4 3 5产件=4 8 J p=4 8 37.1 5 (1)9 0%置信区间为P Z
35、:j3/二 -23 土1645*|产二 23 0 049(2)9 5%置信区间为P土 Z:一忤3=0 2 3 1.9 6 x 理湃=0.2 3 土 0,0 5 8小 r 6 I 2.57622 X10002,七 一 二,7.1 6 E =Z f=n =-=-=1 6 5.8 9 所以 n 为 1 6 6彳 G E2 2 0 027.1 7 =/丫Z 乃(1 一万),(5)_ 2.0 5 4 2 x 0.4 x 0 2F 0 X)?=2 5 3.1 3 所以 n 为 2 5 42Zf f 乃(1-万),,、J-x0.0 2T 0.0 1 5 r 1.2 5 3 o-3,3 2 67.2 1 s;
36、(%-l)s;+(%-l)s;1 3 x 9 6.8 +6 x 1 0 21+,-2 1 9 9 8.4 4 2(1)2 的 9 0%置信区间为:(%,x2)tal2(n+n2-2)s +=9.8 1.7 2 9 x J 9 8.4 4 2 xV l 2=9.8 7.9 4 1 1(2)的 9 5%置信区间为:(X 1 尤,)土+,一 2)5 I I-9.8 土 2.0 9 3 x J 9 8.4 4 2 xV 1 2=9.8 9.6 1 3(3)从-2 的 9 9%置信区间为:9.8 2.8 6 0 9 x 7 9 8.4 4 2 x9.8 1 3.1 4 07.2 2 (1)(x,-x2)
37、za/2-=2 1.9 6 x V 0 3 6=2 1.1 7 62 1(-l)s;+(,-1 应 9 x 1 6 +9 x 2 0 ,。-1 8+%2 1 8(%.-x2)t 2(n.+n2-2)5 +-22.1x/i8 x =2 3.9 8n,n2 V 5(4)t0 0 2 5(2 8)=2.0 4 8,2p=(/TM+(2-1对=1 8.7 1 4%+%一 2(xi-x2)ta/2(ni+n2-2)sp1nl4-=2 1 2.0 4 8 x 7 1 8/7 1 4 x2,1 1-1-1 0 2 0=2 3.4 3(5)v(S;/j 2 1(S;/%)2-1J 6 2 0、21 0 2 2
38、 0=2 0.0 51.62 I2-1-9 1 9%2(切=2.0 8 6(x,-x2)ta/2(v)2 1=2 2.0 8 6 x J l.6 +1 =2 3.3 6 47.2 3-7(1)d =S 4 d一一 嗫 百(2)d,2(-1)孚=Z48 5Nn 47.2 4“2(-1)=2.6 2 1 6 7 =11,%=6.5 3 1 9 7 4 的置信区间为:7.2 5d r,2(n-1)=1 l 2.6 2 1 6 x6.5 3 1 9 7V 1 0=1 1 5.4 1 5 2 他 一,2)士 Z a/2P.O-P i),P 2O-P 2)=0.1 1.6 4 5 x丝包+0.3 x 0.
39、7 6 =O.O Q6982 5 02 5 04=0.1 L9 6 x104x 0.6 0.3 x 0.7 6V 2 5 0 +-2 5 0 =0.1 0.0 8 3 17.2 6 5,=0.2 4 1 6 0 9 52=0.0 7 6 4 5 7Fa/2(n,-l,n2-l)=0 2 5(2 0,2 0)=2.4 6 4综9 7 5(2 0,2 0)=0.4 0 5 7 69.9 8 6 /(T;/9.9 8 6-,-2.4 4 6 a 0.4 0 5 7 624.0 5 2 8 L 2 4.6 1 167”GJ 乃(1-幻 1.9 6 2 x 0.0 2 x 0.9 8 .7.2 7 n=
40、-=-z-=4 7.0 6E2 0.0 42所 以 n =4 87 28 J ,2)22_ 1.962X1202E2 2 02所 以 n =1 3 9第8章假设检验二、练习题(说明:为了便于查找书后正态分布表,本答案中,正态分布的分位点均采用了下侧分位点。其他分位点也可。为了便于查找书后t分布表方便,本答案中,正态分布的分位点均采用了上侧分位点。)8.1 解:根据题意,这是双侧检验问题。%:=4.5 5:w 4.5 5已知:总体方差 y 2=0.1 0 5 2A)=4.5 5,x =4.4 8 4,n=9,显著水平 a =0.0 5z元一o _ 4.4 8 4-4.5 5(j/4 n 0.1
41、0 8/V 9=1.8 3 3 3当 a =0.0 5 ,查表得 Z i7/2 =1-9 6。拒绝域 W=|z|M|Z _ a/2|因为IW Y卜“21,所以不能拒绝H o,认为现在生产的铁水平均含碳量为4.5 5(注:弓_ /2为正态分布的L a/2下侧分位点)8.2解:根据题意,这是左单侧检验问题。%2 7 0 0%:Y 7 0 0已知:总体方差。2=6()2 o=7 0 0,x-6 8 0,n-36,显 著 水 平a =0.0 5x-6 8 0 -7 0 0Z =-=-=-2c r/Vw 6 0/V36当a =0.0 5,查表得=L 6 45。拒绝域 W=Z Y -Z _ a 因为Z=-
42、2 Y-Z a,所以拒绝H o,认为该元件的使用寿命低于7 0 0 小时。(注:为正态分布的1-a下侧分位点)8.3解:根据题意,这是右单侧检验问题。H0:p 25 0H:A 25 0已知:总体方差。2=3()2o=25 O,x=27 0,n=25,显著水平 a =0.0 5x-p0 27 0-25 0Z =-T=-1=-=3.3333c /y/n 30/V25当a =0.0 5,查表得=16 45。拒绝域 W=Z A Z|_ a 因为z =3.3333 A z a,所以拒绝H o,认为这种化肥能使小麦明显增产。(注:为正态分布的La下侧分位点)8.4解:根据题意,这是双侧检验问题。Ho:=1
43、0 0%:*10 0方差c r?未知。已知:总 体 ()=4.5 5,显 著 水 平a =0.0 5根据样本计算得:x=9 9.9 7 7 8,5 =1.2122,=9”号二 9 9.9 7 7 8-y 7 0 5 4 9s/1.2122/0.0 5已知:p =&=o12,乃0=。5,n=5 0,显 著 水 平a =0.0 5p一万o0.12-0.0 5 一=2.27 110.0 5 x0.9 55 0当 a =0.0 5 ,查表得=1.6 45。拒绝域 W=z M Z|_ a 因为Z =2.27 11 A za,所以拒绝Ho,认为不符合标准的比例超过5%,该批食品不能出厂。(注:Z 1_ a
44、为正态分布的1-a下侧分位点)8.6 解:根据题意,这是右单侧检验问题。Ho:/25 0 0 0:a 25 0 0 0已 知:/0=25 0 0 0,x=27 0 0 0,s =5 0 0 0,n=15,显 著 水 平a =0.0 5x-27 0 0 0-25 0 0 0777T-5 0 0 0/V B当a =0.0 5,查表得七(14)=1.7 6 13。拒绝域 W=f AQ(14)因为r =1.5 49 2Y%(14),所以不能拒绝H0,认为该厂家的广告不真实。(注:%(14)为t分布的a上侧分位点)8.7 解:根据题意,这是右单侧检验问题。/70:/225:A 225已知:=225,=2
45、41.5,s=9 8.7 25 9,=16,显 著 水 平a =0.0 5元-4 _ 241.5-225s/4 n 9 8.7 25 9/V15=0.6 47 3当a =0.0 5,查表得 f&(15)=1.7 5 31。拒绝域 W=f A J(15)因为f =0.6 47 3 Y%(14),所以不能拒绝Ho,认为元件的平均寿命不大于225小时。(注:Q(15)为t分布的a上侧分位点)8.8 解:根据题意,这是右侧检验问题。Wo:(T2 10 0已知:%=1 0,s =14.6 8 8 4,n=9,显 著 水 平a =0.0 52(H-1)52 8 xl4.6 8 8 42=隽=1 0=17.
46、25 9 9当a =0.0 5,查表得力/=6 5 0 7 3。拒绝域W=力2 /&2(8)因为力2 =17.25 9 9 力1 8),所以拒绝Ho,认为|:(7 210()成立。(注:/伊)为72分布的a上侧分位点)8.9 解:根据题意,这是双侧检验问题。“0 -%=H :A _ RB 工0已知:总体方差b/=6 32,=5 7 2元=10 7 0,A=8 1;XB=10 20,nf i=6 4,显著水平 a =0.0 5元一亏 10 7 0-10 20=5.0 0 5 9当a =0.0 5,查表得 za/2=1 9 6。拒绝域亚=国8卜5/2|因为国=5.0 0 5 9 MLY,所以拒绝H
47、O,可以认为A,B两厂生产的材料平均抗压强度不相同。(注:Za/2为正态分布的L a/2下侧分位点)8.10 解:根据题意,这是双侧检验问题。“0 :M-2=0一2 HO已知:总体方差b:=0,但未知x,=3 1.7 5,n,=12;右=28.6 6 6 7,%=12,S p =3.20 30 显著水平 a =0.0 5x-x231.7 5-28.6 6 6 7P3.20 302.3579当 a =0.0 5,查表得%2(23)=2.0 6 8 7。拒绝域W=,%2(23)|因为W=2.35 7 9 x%/2(23)|,所以拒绝H。,认为两种方法的装配时间有显著差异。(注:J (23)为t分布
48、的a上侧分 位 点)8.11 解:根据题意,这是双侧检验问题。H y*7t 7C 2H :9w7 2已知:P=4313-2-0-5 ,2=-1-3-4,“1=20 5,n2 134,p-,2 339显 著 水 平a =0.0 5在大样本条件下z =PP2P(l-P)(+-)243 1320 5 1345 6 5 6=2.7 329339 339 20 5 134当a =0.0 5,查表得 za/2=L 9 6。拒绝域 W=|z|Z 1_ a/2|因为|z|=2.7 329 A|za/2|,所以拒绝Ho,认为调查数据支持“吸烟者容易患慢性气管炎”这种观点。(注:Za/2为正态分布的l-a/2下侧
49、分位点)8.12 解:根据题意,这是右单侧检验问题。%:=6 0(1)%,a 6 0等 同 于(2)H):/J =60H、:6 0已知 1:o=6 0,x=6 8.1,5 =45,=144z_ 6 8.1-6 0s/4 n _ 45/V144=2.16在n=144情况下,(2)中的Ho成立时,t近似服从标准正态分布。因此 P=P(t 2.16)=1-0.9 8 46=0.0 15 4 o所以在a =0.0 1的显著水平,不能拒绝Ho,认为贷款的平均规模没有明显超过6 0万元。8.13 解:根据题意,这是左单侧检验问题。H():71 x=71?H:)Y乃2Pl已知:p210 4-,n.110 0
50、 0 118 9-1-1-0-0-0-,几2211000,11000,=显 著 水 平 a =o.O 52 2 000在大样本条件下PP2/?(1-/7)(1+)n n2104 18 911000 11000席”启 壶+四=-4.9 9 9 2当a =0.0 5,查表得=L 6 4 5。拒绝域 W=z Y-Zi_a)因为z=-4.9 9 9 2 Y-z a,所以拒绝H o,认为阿司匹林可以降低心脏病发生率。(注:为正态分布的1-a下侧分位点)8.14解:(1)根据题意,这是双侧检验问题。H0:a2=0.03%:cr2 w O.03已知:cr02=0.03,s2=0.03 7 5,n=8 0,显