《第二章-参数估计与假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《第二章-参数估计与假设检验ppt课件.ppt(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第第5章章 假设检验假设检验本章教学目标本章教学目标n了解和掌握统计推断中的另一个基本问题:参假设检验及其在经济管理中的应用;n掌握运用 Excel 的“数据分析”及其统计函数功能求解假设检验问题。1在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确本章主要内容本章主要内容5.1 案例介绍 5.2 假设检验的基本原理5.3 单个正态总体均值的检验 5.4 单个正态总体方差的检验5.5 两个独立正态总体均值的检验5.6 成对样本试验
2、的均值检验5.7 两个正态总体方差的检验5.5 总体比例的检验本章重点:本章重点:假设检验中不可避免的两类错误及其应用 Excel“数据分析”功能的使用及其运行输出结果分析。难点:难点:假设检验中不可避免的两类错误及其应用。2在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确5.1 案例介绍案例介绍【案例【案例1 1】新工艺是否有效?】新工艺是否有效?某厂生产的一种钢丝的平均抗拉强度为 10560(kg/cm2)。现采用新工艺生产了一种新钢丝,随机抽取 10 根,测得抗拉强度为:10512,10623,10668,10554,10776
3、 10707,10557,10581,10666,10670求得新钢丝的平均抗拉强度为 10631.4(kg/cm2)。是否就可以作出新钢丝的平均抗拉强度高于原钢丝,即新工艺有效的结论?3在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确某台加工缸套外径的机床,正常状态下所加工缸套外径的标准差应不超过 0.02 mm。检验人员从加工的缸套中随机抽取 9 个,测得外径的样本标准差为 S=0.03 mm。问:该机床的加工精度是否符合要求?【案例【案例2】机床加工精度是否符合要求】机床加工精度是否符合要求?4在整堂课的教学中,刘教师总是让学生
4、带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确新车的平均首次故障里程数是汽车的一个主要可靠性指标。现测得甲、乙两种品牌轿车的首次故障里程数数据如下:甲品牌 X1:1200,1400,1580,1700,1900乙品牌 X2:1100,1300,1800,1800,2000,2400 其中 【案例【案例3 3】两种轿车的质量有无差异?】两种轿车的质量有无差异?问:能否据此判定乙品牌轿车的平均首次故障里程高于甲品牌?=1733=1556,5在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确为分析甲、乙两种安眠药的
5、效果,某医院将20个失眠病人分成两组,每组10人,两组病人分别服用甲、乙两种安眠药作对比试验。试验结果如下:两种安眠药延长睡眠时间对比试验(小时)(1)哪种安眠药的疗效好?(2)如果将试验方法改为对同一组10个病人,每人分别服用甲、乙两种安眠药作对比试验,试验结果仍如上表,此时结论如何?【案例【案例4】哪种安眠药的疗效好?】哪种安眠药的疗效好?6在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确【案例案例5】某一系列电视剧是否获得成功】某一系列电视剧是否获得成功如果能够证明某一系列电视剧在播出的头13周其观众的收视率超过了25,则可以断
6、定它获得了成功。假定由400个家庭组成的样本中,有112个家庭在头13周看过了某系列电视剧。现在要判断这部电视剧是否获得了成功。7在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确【案例案例6 6】女企业家对成功的理解是否不同 对女企业家进行了一项研究来看她们对成功的理解。给她们提供了几个备选答案,如快乐/自我实现,销售/利润,成就/挑战。根据她们业务的总销售额将其分为几组。销售额在10万50万元的在一组,少于10万元的在另一组。要研究的问题是:把销售/利润作为成功定义的比率,前一组是否高于后一组?8在整堂课的教学中,刘教师总是让学生带
7、着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确5.2 假设检验的原理假设检验的原理一、实际推断原理假设检验的理论是小概率原理,又称为实际推断原理,其具体内容是:小概率事件在一次试验中是几乎不可能发生的。二、假设检验推理的思想方法假设检验推理的思想方法是某种带有概率性质的反证法。9在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、基本原理和步骤三、基本原理和步骤例例1:统计资料表明,某电子元件的寿命 XN(0,2),其中 0 已知,2 未知。现采用了新工艺生产,测得新工艺生产的 n 个元件寿命为 x1,x2,
8、xn。问:新工艺生产的元件期望寿命 是否比原工艺的元件期望寿命 0 有显著提高?此问题要推断的是:是否 0?这可用假设检验的方法解决,步骤如下:.5.2 假设检验的原理假设检验的原理10在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确1.1.提出一个希望推翻的假设提出一个希望推翻的假设,本例中 H0:=02.按希望出现的结果提出一个与原假设对立的假设,按希望出现的结果提出一个与原假设对立的假设,称为备择假设,记为称为备择假设,记为 H1。本例中 H1:03.构造一个能用来检验原假设构造一个能用来检验原假设 H0 的统计量的统计量t(n
9、-1)本例中,要检验的是总体均值,当 H0 为真时,估计,故应使用来构造检验 的统计量。统计量称为原假设称为原假设,记为记为 H011在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确4.给定一个小概率给定一个小概率 ,称为显著性水平称为显著性水平显著性水平 是当 H0 为真时,拒绝 H0 的概率(即犯“弃真”错误的概率)。也即当检验结果拒绝 H0 时,不犯错误的概率为 1-,从而可以有1-的可信度接受备择假设 H1。5.确定要拒绝确定要拒绝 H0 时统计量的取值范围,时统计量的取值范围,称为称为拒绝域拒绝域,拒绝域的边界点称为拒绝域的
10、边界点称为临界值临界值。本例中,由于 H1:0 而当 H0 为真时,有 P t t(n-1)=1-可知当统计量 t t(n-1)时,就可以有1-的把握判定H0 不真(犯错误的概率仅为 ),故此时应拒绝 H0。从而拒绝域为 t t(n-1),临界值为 t(n-1)。(右边检验),12在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确6.计算统计量计算统计量 t 的值,的值,t(n-1)0f(x)x右边检验的拒绝域本例中,若计算结果为 t t(n-1),并作出检验结论并作出检验结论则拒绝 H0,接受 H1,即在水平 下,认为 显著高于 0。
11、若 t t(n-1)|H0 为真=可知检验中可能出现以下两类判断错误:二二.检验中可能犯的两类错误检验中可能犯的两类错误第一类错误第一类错误当 H0 为真时拒绝 H0 的错误,即“弃真”错误,犯此类错误的概率为。第二类错误第二类错误 当 H0 不真时接受 H0 的错误,即“取伪”错误,记犯该类错误的概率为,即P tt(n-1)H0 不真=由于 H0 不真时与 H0 为真时,统计量 t 的分布是不同的,故 1-。14在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确H0:无辜无辜法官判决法官判决假设检验假设检验实际情况实际情况实际情况实际
12、情况判决判决无辜有罪决策决策H0 真H0 假无辜CorrectError没有拒绝H01-a aType IIError(b b)有罪ErrorCorrect拒绝H0Type IError(a a)Power(1-b)Result Possibilities结果的各种可能性结果的各种可能性在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确Relationship Between a&a&间的联系间的联系 两个错误有反向的关两个错误有反向的关系系在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的
13、问题也很明确两类错误的关系两类错误的关系由图可知,减少 会增大,反之也然。在样本容量 n 不变时,不可能同时减小犯两类错误的概率。应着重控制犯哪类错误的概率,这应由问题的实际背景决定。n当第一类错误造成的损失大时,就应控制犯第一类错误的概率 (通常取 0.05,0.01等);n反之,当第二类错误造成的损失大时,就应控制犯第二类错误的概率。要同时减小须犯两类错误的概率,必须增大样本容量 n。x0H0:=0t(n-1)H1:=117在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确t(n-1)/2/2 t/2(n-1)-t/2(n-1)0f
14、(x)x1-5.3 单个总体均值的检验单个总体均值的检验 设 XN(,2),2 未知,X1,X2,Xn 为总体X 的样本,给定水平,原假设为 H0:=0(0为某一给定值)当 H0 为真时,统计量1.H1:0 (双边检验双边检验)当 H0 为真时,由 P-t/2(n-1)tt/2(n-1)=1-可得:若|t|t/2(n-1)就拒绝 H0,接受 H1;否则接受 H0。18在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 当 H0 为真时,由 P t t(n-1)=1-可得:若 t t(n-1)就拒绝 H0,接受 H1;否则就认为 并不显著
15、高于 0。3.H1:0 (左边检验左边检验)由 P t -t(n-1)=1-可得:若 t 0 (右边检验右边检验)19在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确案例案例1.检验新工艺的效果检验新工艺的效果某厂生产的一种钢丝抗拉强度服从均值为10560(kg/cm2)的正态分布,现采用新工艺生产了一种新钢丝,随机抽取10根测得抗拉强度为:10512,10623,10668,10554,10776 10707,10557,10581,10666,10670问在显著性水平 =0.05下,新钢丝的平均抗拉强度比原钢丝是否有显著提高?20
16、在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确案例案例 1 解答:解答:说明新工艺对提高钢丝绳的抗拉强度是有显著效果的。本案例为右边检验问题,设新钢丝的平均抗拉强度为,2 未知,故使用t 检验。由题意,H0:=0,H1:0由所给样本数据,可求得:S=81,n=10,=0.05,t0.05(9)=1.8331 t=2.7875 故拒绝 H0,即在水平 =0.05下,显著高于 0。t(n-1)=t0.05(9)=1.833121在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确在
17、案例在案例1中,若取中,若取 =0.01,问结论如何,问结论如何?【解】t0.01(9)=2.8214,t=2.7875 P0 P 25%,样本比例 p=112/400=0.2825在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 设 H0:2=02 (02为某一给定值)则当 H0为真时,统计量 与前面分析完全类似地,可得如下检验方法:5.5.单个总体方差的检验单个总体方差的检验 2 02 2 02 2 02 故拒绝 H0,即该机床加工精度已显著下降。应立即停工检修,否则废品率会大大增加。【案例【案例2】机床加工精度问题机床加工精度问
18、题28在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确课堂练习课堂练习 4 一台奶粉自动包装的包装精度指标为 标准差=0.005(kg)某天开工时,随机抽检了 10 袋产品,测得其样本标准差为 S=0.00554(kg)(1)在水平 =0.25 下,检验该天包装机的包装精度是否符合要求。(2)在本检验问题中,为什么要将 取得较大?29在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确统计意义上的显著和实际的显著统计意义上的显著和实际的显著 有时,由于非常大的样本容量,你很有可能
19、会得出统计意义上的显著性但实际中的显著性却很小。比如,假设在全国性的关于高档次的商业电视市场推广活动之前,你知道人们对你的品牌认知度是0.3。在活动结束之后,根据对20,000人的调查显示有6,168人认识你的品牌。单边检验希望能证明现在的认知比例是大于0.3,而p-值结果为0.0047,正确的统计结论是品牌名字消费者的比例现在取得了显著性改变,而在实际上这个增长重要吗?总体比例现在的估计值在6,168/2,00000.3084,或是30.84%。这个增长量只比假设检验值30%多了1%。在市场推广活动中的高额费用产生的结果是否对品牌认知度有意义呢?现实中的低于1的市场认知度的微小增长与高成本的
20、市场活动费用相比,你应该认为这次市场活动是不成功的。如果品牌知名度提高了20,你就能得出活动是非常成功的。30在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确5.6.两个总体均值的检验两个总体均值的检验设总体 X1 N(1,12),X2N(2,22),且 X1和 X2 相互独立。和 S12,S22 分别是它们的样本的均值和样本方差,样本容量分别为 n1和 n2。原假设为H0:1=2 31在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确可以证明,当 H0 为真时,统计量其中:完
21、全类似地,可以得到如下检验方法:t(n1+n2-2)称为合并方差。1.12=22=2,但但 2 未知未知(t 检验检验)32在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确测得甲,乙两种品牌轿车的首次故障里程数数据如下:甲品牌 X1:1200,1400,1580,1700,1900乙品牌 X2:1100,1300,1800,1800,2000,2400设 X1和 X2 的方差相同。问在水平 0.05 下,(1)两种轿车的平均首次故障里程数之间有无显著差异?(2)乙品牌轿车的平均首次故障里程是否比甲品牌有显著提高?【案例【案例3】轿车质
22、量差异的检验】轿车质量差异的检验33在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确解:解:双边检验问题S12=269.62,S22=471.9212=22=2 未知,n1=5,H0:1=2H1:12。由所给数据,可求得|t|=0.74 -t(n1+n2-2)=-t0.05(9)=-1.833故乙品牌轿车平均首次故障里程并不显著高于甲品牌。显然,对给定的水平,若单边检验不显著,则双边检验肯定不显著。但反之却不然,即若双边检验不显著,单边检验则有可能是显著的。H1:1235在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具
23、有一定的梯度,由浅入深,所提出的问题也很明确用用 Excel 检验两总体均值检验两总体均值可用 Excel 的【工具】“数据分析”“t检验:双样本等方差假设”,检验 12=22=2,但 2未知时两个总体的均值。在Excel 的输出结果中:“P(T=t)单尾”t(统计量)0f(t)“P(T=t)单尾”的值(概率)单边检验达到的临界显著性水平临界显著性水平;“P(T=t)双尾”双边检验达到的临界显著性水平临界显著性水平。由图可知:P(T=t)双尾=2P(T=t)单尾 “P(T=t)单尾”和“P(T=t)双尾”统称为“p 值值”。36在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有
24、一定的梯度,由浅入深,所提出的问题也很明确“P(T=t)单尾单尾”与与“P(T=t)双尾双尾”的使用的使用 从而,若“P(T=t)单尾”或“P(T0.05,则结果为不显著;“P(T=t)单尾”或“P(T=t)双尾”0.05,则一般显著;“P(T=t)单尾”或“P(T=t)双尾”0.01,则高度显著;“P(T=t)单尾”或“P(T=t)双尾”0.001,则极高度显著。本例中:“P(T0.05;“P(T0.05,故无论单边还是双边检验结果都不显著。tt“P(T t 等价于“P(T=t)单尾”t/2 等价于“P(T=t)双尾”t 0.005(9)=3.2498 案例案例 5 解答解答41在整堂课的教
25、学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 可用 Excel 的【工具】“数据分析”“t检验:平均值的成对二样本分析”进行成对样本试验的均值检验。用 Excel 求解 本例中“P(T=t)双尾”=0.0028 F(n1,n2)=的数值 F(n1,n2)。F(n1,n2)f(x)x0F(n1,n2)有以下性质:F1-(n1,n2)=1/F(n2,n1)利用上式可求得 F 分布表中未给出的 值的百分位点。如 F0.95(10,15)=1/F0.05(15,10)45在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由
26、浅入深,所提出的问题也很明确可用 Excel 的统计函数 FINV 返回 F(n1,n2)。语法规则如下:格式:FINV(,n1,n2)功能:返回 F(n1,n2)的值。用 Excel 求 F(n1,n2)46在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确2.两总体方差的检验两总体方差的检验(F 检验检验)原假设为 H0:12=22。完全类似地,可以得到如下检验方法:F(n1-1,n2-1)当 H0为真时,统计量 47在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确【例【例
27、2】在 0.20下,检验【案例3】中两个正态总体的方差是否存在显著差异。解解:由题意,H0:12=22,H1:1222,n1=5,n2=6由例5的计算结果,S12=269.62,S22=471.92=0.326 F/2(n1-1,n2-1)=F0.1(4,5)=3.52 F1-/2(n1-1,n2-1)=F1-0.1(4,5)=1/F0.1(5,4)=1/4.05=0.247F=0.326 F1-0.1(4,5)=0.247 F0.1(4,5)=3.52故在水平 =0.20下,12 与 22 间无显著差异。可知案例4 中关于 12=22 的假定是合理的。思考题思考题:本例中为什么要将本例中为什
28、么要将 取得较大?取得较大?48在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 可用 Excel 的【工具】“数据分析”“F检验:双样本方差”检验两个正态总体是否是同方差的。在 Excel 的输出结果中 “P(F=f)单尾”与“P(T=t)单尾”的含义是相同的,即 p 值。用 Excel 求解 本例中“P(F 0.20故在在水平 0.20下,12 与 22 间无显著差异。49在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确5.9.大样本两个总体比例的检大样本两个总体比例的检
29、验验设 P1,P2 分别是两个独立总体的总体比例,原假设为 H0:P1=P2 设 p1,p2 分别是它们的样本比例,n1,n2 分别是它们的样本容量。则在大样本的条件下,统计量由此,可以得到如下检验方法:50在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确【案例6】女企业家对成功的理解是否不同对女企业家进行了一项研究来看她们对成功的理解。给她们提供了几个备选答案,如快乐/自我实现,销售/利润,成就/挑战。根据她们业务的总销售额将其分为几组。销售额在100万500万元的为一组,少于100万元的为另一组,要研究的问题是:把销售/利润作为成
30、功定义的比率,前一组是否高于后一组?假定我们以总销售额对女企业家进行定位。我们采访了100名总销售额低于100万元的女企业家,她们中有24个将销售/利润定义为成功。随后我们又采访了95名总销售额在100万500万元的女企业家,其中有39人把销售/利润定义为成功。问在显著性水平0.01下,两组中将销售/利润定义为成功的比率是否有显著的差异。51在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 单个总体=0两个独立总体1=2成对样本=0两个独立比例P1=P2比例P=P0 2未知12=22未知两总体不独立化为单个总体均值 0 0 21 P2P1 2212 02 2 0.0052 时,包装精度才不符合要求,故本问题是右边检验。H0:2=0.0052,H1:2 0.0052,=0.25不能拒绝 H0,包装机精度符合要求。(2)对于机床精度的检验问题,犯第一类错误(精度符合要求但判定不符合要求)的损失很小;而犯第二类错误(精度已显著下降但判定仍符合要求)的损失很大。因此应控制犯第二类错误的概率,取较大的 可使较小。59