六西格玛数据分析技术5.pptx

上传人:修**** 文档编号:5706174 上传时间:2022-01-15 格式:PPTX 页数:37 大小:595.99KB
返回 下载 相关 举报
六西格玛数据分析技术5.pptx_第1页
第1页 / 共37页
六西格玛数据分析技术5.pptx_第2页
第2页 / 共37页
点击查看更多>>
资源描述

《六西格玛数据分析技术5.pptx》由会员分享,可在线阅读,更多相关《六西格玛数据分析技术5.pptx(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、SSMC中国人民大学六西格玛质量管理研究中心六西格玛管理培训丛书(5)o 何晓群何晓群 主编主编 六西格玛数据分析技术六西格玛数据分析技术何晓群 编著光盘作者:陶 沙 苏晨辉中 国 人 民 大 学 出 版 社SSMC中国人民大学六西格玛质量管理研究中心第5章 假设检验 5.1 广告宣传的虚假性 5.2 假设检验(hypothesis testing)的几个步骤 5.3 单侧检验(one-tailed hypothesis) 5.4 双侧检验(two-tailed hypothesis) 5.5 两类错误 5.6 检验的应用 小组讨论与练习返回目录SSMC中国人民大学六西格玛质量管理研究中心本

2、章 目 标1.了解假设检验的原理2.掌握假设检验的步骤3.了解怎样辨别I类和II类错误4.学会计算单尾和双尾概率返回目录SSMC中国人民大学六西格玛质量管理研究中心5.1 广告宣传的虚假性l手机电池的使用寿命不是按年来计算的,而是按电池的充放电次数来计算的。镍氢电池一般可充放电200-300次,锂电池一般可充放电350-700次。某手机电池厂商宣称其一种改良产品能够充放电900次,为了验证厂商的说法,消费者协会对10件该产品进行了充放电试验。得到的次数分别为891,863,903,912,861,885,874,923,841,836。返回目录SSMC中国人民大学六西格玛质量管理研究中心广告宣

3、传是虚假的吗 上述数据的均值为878.9,明显少于900。但是,到底均值落在什么范围内我们就认为广告宣传是虚假的呢?900接受广告宣传接受广告宣传现在的问题是如现在的问题是如何确定这两条线何确定这两条线的位置的位置返回目录SSMC中国人民大学六西格玛质量管理研究中心假设检验的原理l假设检验的原理是逻辑上的反证法逻辑上的反证法和统计上的小概率原理统计上的小概率原理l反证法:当一件事情的发生只有两种可能A和B,如果能否定B,则等同于间接的肯定了A。l小概率原理:发生概率很小的随机事件在一次实验中是几乎不可能发生的。返回目录SSMC中国人民大学六西格玛质量管理研究中心假设检验的原理(续)l由于个体差

4、异的存在,即使从同一总体中严格的随机抽样,X1、X2、X3、X4、,也不尽不同。l它们的 不同有两种(只有两种)可能:(1)分别所代表的总体均值相同,由于抽样误差造成了样本均值的差别。差别无显著性 。(2)分别所代表的总体均值不同。差别有显著性。返回目录SSMC中国人民大学六西格玛质量管理研究中心5.2 假设检验的几个步骤 假设检验的一般步骤,即提出假设、确定检验统计量、计算检验统计量值、做出决策。 提出假设 构造统计量 做出统计 决策 计算统计量值 做出推断返回目录SSMC中国人民大学六西格玛质量管理研究中心提出假设l在决策分析过程中,人们常常需要证实自己通过样本数据对总体分布形式做出的某种

5、推断的正确性(比如,总体的参数大于某个值0),这时就需要提出假设,假设包括零假设H0与备择假设H1。返回目录SSMC中国人民大学六西格玛质量管理研究中心零假设的选取l假设检验所使用的逻辑上的间接证明法 决定了我们选取的零假设应当是与我们希望证实的推断相对立的一种逻辑判断,也就是我们希望否定的那种推断。返回目录SSMC中国人民大学六西格玛质量管理研究中心零假设的选取(续一)l同时,作为零假设的这个推断是不会轻易被推翻的,只有当样本数据提供的不利于零假设的证据足够充分,使得我们做出拒绝零假设的决策时错误的可能性非常小的时候,才能推翻零假设。返回目录SSMC中国人民大学六西格玛质量管理研究中心零假设

6、的选取(续二)l所以,一旦零假设被拒绝,它的对立面我们希望证实的推断就应被视为是可以接受的。返回目录SSMC中国人民大学六西格玛质量管理研究中心构造检验统计量l收集样本信息l利用样本信息构造检验统计量返回目录SSMC中国人民大学六西格玛质量管理研究中心计算检验统计量值l把样本信息代入到检验统计量中,得到检验统计量的值。返回目录SSMC中国人民大学六西格玛质量管理研究中心做出决策1、 规定显著性水平,也就是决策中所面临的风险2、决定拒绝域(critical region)和判别值(critical value)3、判定检验统计量是否落在拒绝域内4、得出关于H0和关于H1的结论返回目录SSMC中国

7、人民大学六西格玛质量管理研究中心显著性水平l显著性水平是当原假设正确却被拒绝的概率l通常人们取0.05或0.01l这表明,当做出接受原假设的决定时,其正确的可能性(概率)为95%或99%返回目录SSMC中国人民大学六西格玛质量管理研究中心判定法则1 1、如果检验统计量落入拒绝域中,则拒绝原假设、如果检验统计量落入拒绝域中,则拒绝原假设2 2、如果检验统计量落入接受域中,则我们说不能拒绝原假设、如果检验统计量落入接受域中,则我们说不能拒绝原假设注意:判定法则2的含义是指我们在这个置信水平下没有足够的证据推翻原假设;实际上,如果我们改变置信水平或样本数量就有可能得到与先前相反的结果。返回目录SSM

8、C中国人民大学六西格玛质量管理研究中心零假设和备择假设零假设零假设 备择假设备择假设1.大于等于() 小于()2.小于等于() 大于()3. 等于() 不等于()可能的零假设和备择假设的情况可能的零假设和备择假设的情况返回目录SSMC中国人民大学六西格玛质量管理研究中心5.3 单侧检验(one-tailed hypothesis)l某种果汁的包装上标明其原汁含量至少为90%。假定我们想通过假设检验对这项说明进行检验。返回目录SSMC中国人民大学六西格玛质量管理研究中心检验的方向性l如果要检验的问题带有方向性,如灯泡寿命、电池时效、头盔防冲击性等数值是越大越好;零件废品率、生产成本等数值则是越小

9、越好,这类问题的检验就属于单侧检验。返回目录SSMC中国人民大学六西格玛质量管理研究中心临界值0.05接受域拒绝域单侧检验拒绝域和临界值接受域00.05拒绝域10.95 临界值左单侧检验左单侧检验右单侧检验右单侧检验返回目录SSMC中国人民大学六西格玛质量管理研究中心单侧检验的例子l例例51: 1:一家食品公司广告说他的一种谷物一家食品公司广告说他的一种谷物一袋有一袋有2424千克。消费者协会想要检验一下这千克。消费者协会想要检验一下这个说法。他们当然不可能打开每袋谷物来检个说法。他们当然不可能打开每袋谷物来检查,所以只能抽取一定数量的样品。取得这查,所以只能抽取一定数量的样品。取得这个样本的

10、均值并将其与广告标称值作比较就个样本的均值并将其与广告标称值作比较就能做出结论。请给出该消费者协会的零假设能做出结论。请给出该消费者协会的零假设和备择假设。和备择假设。返回目录SSMC中国人民大学六西格玛质量管理研究中心单侧检验的例子(续一)解解:(一)、(一)、首先找出总体参数,这里应该是总体的均值首先找出总体参数,这里应该是总体的均值m,即谷物的平均重量,即谷物的平均重量,给出原假设和备择假设,即用公式表达两个相反的意义。给出原假设和备择假设,即用公式表达两个相反的意义。 H0: m 24 (均值至少为 24) Ha: m 24 (均值少于24)(二)、(二)、确定概率分布和用来做检验的检

11、验统计量。确定概率分布和用来做检验的检验统计量。 我们要检验抽取的样本均值是否达到广告宣称的数额,就可以用样本均我们要检验抽取的样本均值是否达到广告宣称的数额,就可以用样本均值离标称值的标准离差个数的多少来判断。值离标称值的标准离差个数的多少来判断。因此构造检验统计量因此构造检验统计量nxz* 返回目录SSMC中国人民大学六西格玛质量管理研究中心单侧检验的例子(续二)(三)(三)、设定置信水平为设定置信水平为95%95%。收集样本信息,假设选取了一个数。收集样本信息,假设选取了一个数目为目为4040的样本,计算得的样本,计算得计算检验统计量的值为(计算检验统计量的值为( = 0.2 = 0.2

12、)(四)(四)、查表可以得出临界值和拒绝域,也可用计算机输出查表可以得出临界值和拒绝域,也可用计算机输出p p值。值。计算出的计算出的Z Z值落入拒绝域,所以拒绝值落入拒绝域,所以拒绝H H0 0,即意味着我们认为谷,即意味着我们认为谷物的重量达不到厂商宣称的数值物的重量达不到厂商宣称的数值。40 76.23nx5895. 7402 . 02476.23nxz返回目录SSMC中国人民大学六西格玛质量管理研究中心5.4 双侧检验(two-tailed hypothesis)l中宝普通瓶装啤酒的标称容积是640毫升。中宝啤酒公司质检部认识到,如果质量控制失控的话,则该生产线生产的瓶装啤酒液体平均容

13、积将少于或多于640毫升。前一种情况下,会使产品信誉受到损害;后一种情形下,不仅会使成本上升,还有可能造成安全隐患。因此质检部定期从生产线上抽取一定数量的啤酒组成样本来检验其质量是否达到要求。返回目录SSMC中国人民大学六西格玛质量管理研究中心双侧检验l一些产品某一项指标必须满足在某一个范围内,如精密零件的尺寸和重量、保险丝适用的电流强度等等,这类问题的检验属于双侧检验。返回目录SSMC中国人民大学六西格玛质量管理研究中心双侧检验l图例图例:l拒绝域和临界值0拒绝域临界值接受域拒绝域10.95 025. 02 025.02 返回目录SSMC中国人民大学六西格玛质量管理研究中心5.5 两类错误l

14、假设检验是基于样本信息做出的结论,而我们知道样本只是代表了总体的一部份信息,因此必须考虑发生误差的概率。 H0为真时我们拒绝H0的错误称为第I类错误,犯这种错误的概率用来表示,简称为错误或弃真错误; 当H0为伪时我们接受H0的错误称为第II类错误,犯这种错误的概率用来表示,简称为错误或取伪错误。返回目录SSMC中国人民大学六西格玛质量管理研究中心两类错误出现的场合接受零假设接受零假设拒绝零假设拒绝零假设零假设为真零假设为真零假设为假零假设为假返回目录SSMC中国人民大学六西格玛质量管理研究中心 接受H0 拒绝H0,接受H1 H0为真 1(正确决策)(正确决策) (弃真错误)(弃真错误) H0为

15、伪 (取伪错误)(取伪错误) 1 (正确决策)(正确决策)两类错误发生的概率两类错误发生的概率如下表所示:返回目录SSMC中国人民大学六西格玛质量管理研究中心两类错误的关系0接受H0拒绝H001II类错误I类错误返回目录SSMC中国人民大学六西格玛质量管理研究中心例例5 52: 2: 一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障故障. .故障是完全随机的,并假定生产任一零件时出现故障机会均相同故障是完全随机的,并假定生产任一零件时出现故障机会均相同. .工作工作人员是通过检查零件来确定工序是否出现故障的人员是通过检查零

16、件来确定工序是否出现故障的. .现积累有现积累有100100次故障纪录,次故障纪录,故障出现时该刀具完成的零件数如下:故障出现时该刀具完成的零件数如下: 459 362 624 542 509 584 433 748 815 505459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 926 653 164 487 734 608

17、 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 699

18、634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851 764 558 378 765 666 763 217 715 310 851试判断安全加工零件数是否大于试判断安全加工零件数是

19、否大于500.500.5.6 检验的应用返回目录SSMC中国人民大学六西格玛质量管理研究中心假设检验的Minitab实现运行软件,输入数据运行软件,输入数据点击菜单点击菜单Stat-Basic statistics-1-Sample t返回目录SSMC中国人民大学六西格玛质量管理研究中心假设检验的Minitab实现(续一)弹出对话框如图弹出对话框如图输出图像输出图像置信水平及备择假设的选取置信水平及备择假设的选取返回目录SSMC中国人民大学六西格玛质量管理研究中心Minitab输出结果均值均值零假设均值零假设均值 500500p p值小于值小于0.050.05表明拒绝表明拒绝原假设,即原假设,

20、即安全加工安全加工零件数显著大于零件数显著大于500500置信水平置信水平返回目录SSMC中国人民大学六西格玛质量管理研究中心其它注意事项l选择假设检验方法要注意符合其应用条件;l当不能拒绝H0时,即差异无显著性时,应考虑的因素: 可能是样品数目不够; 单侧检验与双侧检验的问题。返回目录SSMC中国人民大学六西格玛质量管理研究中心报纸报导某地汽油的价格是每加仑115美分,为了验证这种说法,一位学者开车随机选择了一些加油站,得到某年一月和二月的数据如下:一月:119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118二月:118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 1251)分别用两个月的数据验证这种说法的可靠性;2)分别给出1月和2月汽油价格的置信区间;3)给出1月和2月汽油价格差的置信区间.小组讨论与练习返回目录

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁