《统计学假设检验 (2)课件.ppt》由会员分享,可在线阅读,更多相关《统计学假设检验 (2)课件.ppt(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于统计学假设检验(2)现在学习的是第1页,共43页正常人的平均体温是正常人的平均体温是3737o oC C吗?吗?当当问问起起健健康康的的成成年年人人体体温温是是多多少少时时,多多数数人人的的回回答答是是3737o oC C,这这似似乎乎已已经经成成了了一一种种共共识识。右右边边是是一一个个研研究究人人员员测测量量的的5050个个健健康康成成年年人人的体温数据的体温数据 37.137.136.936.936.936.937.137.136.436.436.936.936.636.636.236.236.736.736.936.937.637.636.736.737.337.336.936.9
2、36.436.436.136.137.137.136.636.636.536.536.736.737.137.136.236.236.336.337.537.536.936.937.037.036.736.736.936.937.037.037.137.136.636.637.237.236.436.436.636.637.337.336.136.137.137.137.037.036.636.636.936.936.736.737.237.236.336.337.137.136.736.736.836.837.037.037.037.036.136.137.037.0现在学习的是第2页,共4
3、3页正常人的平均体温是正常人的平均体温是3737o oC C吗?吗?根根据据样样本本数数据据计计算算的的平平均均值值是是36.8oC,标标准准差差为为0.36oC 根根据据参参数数估估计计方方法法得得到到的的健健康康成成年年人人平平均均体体温温的的95%的置信区间为的置信区间为(36.7,36.9)。因因此此提提出出“不不应应该该以以37oC作作为为衡衡量量人人的的正正常常体体温的标准温的标准”我我们们应应该该放放弃弃“正正常常人人的的平平均均体体温温是是37oC”这这个个共共识吗?识吗?现在学习的是第3页,共43页假设检验的基本知识假设检验的基本知识假设检验假设检验:先对总体的参数提出某种假
4、设,然后:先对总体的参数提出某种假设,然后利用样本信息判断假设是否成立的统计方法。利用样本信息判断假设是否成立的统计方法。假设检验的步骤假设检验的步骤:1.1.1.1.提出原假设和备择假设提出原假设和备择假设 2.2.2.2.确定适当的检验统计量确定适当的检验统计量确定适当的检验统计量确定适当的检验统计量 3.3.3.3.规定显著性水平规定显著性水平规定显著性水平规定显著性水平 4.4.4.4.计算检验统计量的值计算检验统计量的值 5.5.5.5.做出统计决策做出统计决策做出统计决策做出统计决策现在学习的是第4页,共43页1.1.提出原假设和备择假设提出原假设和备择假设原假设原假设(H(H0
5、0):需要通过样本去推断其正确与否的命题需要通过样本去推断其正确与否的命题 H H0 0:备择假设备择假设(H(H1 1):与原假设相对立的假设。:与原假设相对立的假设。原假设和备择假设是互斥的原假设和备择假设是互斥的现在学习的是第5页,共43页假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H H0 0 =0 0 0 0 0 0H H1 1 0 0 0 0现在学习的是第6页,共43页【例例】20102010年某地新生儿的平均体重为年某地新生儿的平均体重为31903190克,克,现从现从20112011年的新生儿中随机抽取年的新生儿中随机抽取100100个,测个,测
6、得其平均体重为得其平均体重为32103210克,问克,问20112011年的新生年的新生儿与儿与20102010年相比,体重有无显著差异。年相比,体重有无显著差异。H H0 0:=3190=3190(克)(克)H H1 1:31903190(克)(克)2011年新生儿的体重年新生儿的体重 与与2010年无显著差异年无显著差异 2011年新生儿的体重年新生儿的体重 与与2010年有显著差异年有显著差异现在学习的是第7页,共43页【例例】某品牌的洗涤剂在其产品说明书中声称:某品牌的洗涤剂在其产品说明书中声称:每瓶的每瓶的“平均净含量不低于平均净含量不低于500克克”。从消费者的。从消费者的利益出发
7、,有关研究人员要通过抽检其中的一批利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈产品来验证该产品制造商的说明是否属实。试陈述原假设和备择假设。述原假设和备择假设。H H0 0:500 500 (净含量符合说明书)(净含量符合说明书)H H1 1:500500 (净含量不符合说明书)净含量不符合说明书)现在学习的是第8页,共43页【例例】某种大量生产的袋装食品,按规定重量某种大量生产的袋装食品,按规定重量不得少于不得少于250250克。今从一批该种食品中随机克。今从一批该种食品中随机抽取抽取5050袋,发现有袋,发现有6 6袋重量低于袋重量低于250250克
8、。若规克。若规定不符合标准的比例超过定不符合标准的比例超过5%5%,食品就不得出,食品就不得出厂,则该批食品能否出厂?厂,则该批食品能否出厂?H H0 0:5%5%(次品率没有超过上限,可以出厂)(次品率没有超过上限,可以出厂)H H1 1:5%5%(次品率超过上限,不可以出厂)次品率超过上限,不可以出厂)现在学习的是第9页,共43页2.检验统计量的确定检验统计量的确定Z Z 检验检验(单尾和双尾)(单尾和双尾)t t 检验检验(单尾和双尾)(单尾和双尾)Z Z 检验检验(单尾和双尾)(单尾和双尾)2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体参数的检验一个总体参数的检验比例比例方
9、差方差现在学习的是第10页,共43页大大小小已知已知未知未知总体均值的检验统计量的确定总体均值的检验统计量的确定现在学习的是第11页,共43页3.3.规定显著性水平规定显著性水平 显著性水平显著性水平:当原假设正确而人们却把它拒绝了:当原假设正确而人们却把它拒绝了的概率或风险。用的概率或风险。用表示表示常用的常用的值有值有0.01,0.050.01,0.05假设检验中的两类错误假设检验中的两类错误 错误(弃真错误):原假设为真却被拒绝。错误(弃真错误):原假设为真却被拒绝。错误(取伪错误):原假设为伪却被接受。错误(取伪错误):原假设为伪却被接受。现在学习的是第12页,共43页H H0 0:无
10、罪无罪无罪无罪法官审判法官审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假不能拒不能拒绝绝H01-(正确决策)(正确决策)b b(取伪错误(取伪错误)拒绝拒绝H0(弃真错误弃真错误)1-1-b b(正确决策)正确决策)假设检验就好像假设检验就好像假设检验就好像假设检验就好像假设检验就好像假设检验就好像一场审判过程一场审判过程一场审判过程一场审判过程一场审判过程一场审判过程统计检验过程统计检验过程统计检验过程统计检验过程统计检验过程统计检验过程现在学习的是第13页,共43页小概率原理小概率原
11、理小概率原理小概率原理:发生概率很小的随机事件在一次:发生概率很小的随机事件在一次试验中是几乎不会发生的。试验中是几乎不会发生的。假设检验的基本思想假设检验的基本思想:在一次试验中小概率事件:在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。一旦发生,我们就有理由拒绝原假设。现在学习的是第14页,共43页4.4.计算检验统计量的计算检验统计量的值值Z Z统计量:统计量:t t统计量:统计量:或或现在学习的是第15页,共43页5.5.作出统计决策作出统计决策 根据给定的显著性水平根据给定的显著性水平和统计量的分布,查表得和统计量的分布,查表得出相应的临界值。出相应的临界值。将检验统计量的值
12、与临界值进行比较将检验统计量的值与临界值进行比较 得出接受或拒绝原假设的结论得出接受或拒绝原假设的结论双侧检验:双侧检验:左侧检验:左侧检验:右侧检验:右侧检验:现在学习的是第16页,共43页双侧检验的算例双侧检验的算例【例例】某某机机床床厂厂加加工工一一种种零零件件,根根据据经经验验知知道道,该该厂厂加加工工零零件件的的椭椭圆圆度度近近似似服服从从正正态态分分布布,其其总总体体均均值值为为 0 0=0.081mm=0.081mm,总总体体标标准准差差为为0.025mm0.025mm。今今换换一一种种新新机机床床进进行行加加工工,抽抽取取n n=200=200个个零零件件进进行行检检验验,得得
13、到到的的椭椭圆圆度度为为0.076mm0.076mm。试试问问新新机机床床加加工工零零件件的的椭椭圆圆度的均值与以前有无显著差异?(度的均值与以前有无显著差异?(0.050.05)现在学习的是第17页,共43页检验统计量检验统计量检验统计量检验统计量:统计决策统计决策统计决策统计决策:,Z Z值位于拒绝域,值位于拒绝域,值位于拒绝域,值位于拒绝域,所所所所以以以以拒拒拒拒绝绝绝绝H H H H0 0 0 0,可可可可以以以以认认认认为为为为新新新新机机机机床床床床加加加加工工工工的的的的零零零零件件件件的的的的椭椭椭椭圆度与老机床有显著差异圆度与老机床有显著差异圆度与老机床有显著差异圆度与老机
14、床有显著差异H H0 0:=0.081mm =0.081mm 没有明显差异没有明显差异H H1 1:0.081mm 0.081mm 有显著差异有显著差异已知已知0 0=0.081mm=0.081mm,=0.025mm=0.025mm,n=200n=200,因为是大样本,故选择,因为是大样本,故选择Z Z统计量统计量 =0.05=0.05,z z0.0250.025=1.96=1.96解:解:因为因为现在学习的是第18页,共43页【例例】根根据据以以往往经经验验,某某公公司司销销售售人人员员的的销销售售额额近近似似服服从从正正态态分分布布,他他们们的的月月平平均均销销售售额额为为1515万万元元
15、,标标准准差差为为2 2万万元元。公公司司又又召召进进来来3636名名新新销销售售员员,随随机机抽抽取取他他们们某某一一个个月月的的平平均均销销售售额额,为为1212万万元元,试试问问新新员员工工的的月月平平均均销销售售额额与与老老员工有无显著差异?(员工有无显著差异?(0.050.05)现在学习的是第19页,共43页检验统计量检验统计量检验统计量检验统计量:统计决策统计决策统计决策统计决策:,Z Z Z Z值位于拒绝域,值位于拒绝域,值位于拒绝域,值位于拒绝域,所所所所以以以以拒拒拒拒绝绝绝绝H H H H0 0,新新员员工工的的月月平平均均销销售售额额与与老员工相比有显著差异。老员工相比有
16、显著差异。H H0 0:=15=15万元万元 没有明显差异没有明显差异H H1 1:15 15万元万元 有显著差异有显著差异已知已知0 0=15=15万元,万元,=2=2万元,万元,n=36n=36,因为是大样本,故选择,因为是大样本,故选择Z Z统计量统计量 =0.05=0.05,z z0.0250.025=1.96=1.96解:解:因为因为现在学习的是第20页,共43页【例例】一项对项对200200个家庭的调查显示,每个家个家庭的调查显示,每个家庭每天看电视的平均时间为庭每天看电视的平均时间为7.257.25小时小时,标准标准差为差为2.52.5小时。小时。据统计,去年每天每个家庭据统计,
17、去年每天每个家庭看电视的平均时间为看电视的平均时间为7 7小时小时,取显著性水平取显著性水平=0.01=0.01,试证明今年每个家庭每天看电视,试证明今年每个家庭每天看电视的平均时间与去年相比是否有显著差异?的平均时间与去年相比是否有显著差异?现在学习的是第21页,共43页检验统计量检验统计量检验统计量检验统计量:统计决策统计决策统计决策统计决策:,Z Z Z Z值位于接受域,值位于接受域,所所所所以以以以不不不不能能能能拒拒拒拒绝绝绝绝H H H H0 0 0 0,有有理理由由认认为为今今年年每每个个家家庭庭每每天天看看电电视视的的平平均均时时间间与与去去年年相相比比是是无显著差异无显著差异
18、。H H0 0:=7=7小时小时 今年与去年无显著差异今年与去年无显著差异H H1 1:7 7小时小时 今年与去年有显著差异今年与去年有显著差异已知已知0 0=7=7小时,小时,s=2.5s=2.5小时,小时,n=200n=200,因为是大样本,故选择,因为是大样本,故选择Z Z统计量统计量 =0.01=0.01,z z0.0050.005=2.58=2.58解:解:因为因为现在学习的是第22页,共43页左侧检验的算例左侧检验的算例【例例】某批发商欲从厂家购进一批打印墨盒,根据合某批发商欲从厂家购进一批打印墨盒,根据合同规定用这批墨盒打印的纸张数目平均不能低于同规定用这批墨盒打印的纸张数目平均
19、不能低于1000张。已知其墨盒的打印纸张数量服从正态分张。已知其墨盒的打印纸张数量服从正态分布,标准差为布,标准差为200张。在总体中随机抽取了张。在总体中随机抽取了100件墨件墨盒,试验发现平均打印的纸张数量为盒,试验发现平均打印的纸张数量为960张,当显著张,当显著性水平性水平=0.05时,批发商是否应该购买这批墨盒时,批发商是否应该购买这批墨盒?现在学习的是第23页,共43页检验统计量检验统计量检验统计量检验统计量:统计决策统计决策:,Z Z Z Z值位于拒绝域,值位于拒绝域,值位于拒绝域,值位于拒绝域,所以应拒绝所以应拒绝所以应拒绝所以应拒绝H H H H0 0,检验表明这批墨盒的使用
20、寿命低于检验表明这批墨盒的使用寿命低于检验表明这批墨盒的使用寿命低于检验表明这批墨盒的使用寿命低于10001000张,批发商不应购买这批墨盒。张,批发商不应购买这批墨盒。张,批发商不应购买这批墨盒。张,批发商不应购买这批墨盒。H0:H0:10001000张张 应购买墨盒应购买墨盒H1:H1:10001000张张 拒绝购买墨盒拒绝购买墨盒已知已知0 0=1000(=1000(张张),=200(=200(张张),n=100n=100,因为是大样本,故选择,因为是大样本,故选择Z Z统计量统计量 =0.05=0.05,本题为左侧检验,因此,本题为左侧检验,因此z z=1.645=1.645解:解:因
21、为因为现在学习的是第24页,共43页右侧检验右侧检验【例例】电视机显像管批量生产的质量标准为平电视机显像管批量生产的质量标准为平均使用寿命均使用寿命12001200小时,标准差为小时,标准差为300300小时。某小时。某电视机厂宣称其生产的显像管质量大大超过规电视机厂宣称其生产的显像管质量大大超过规定标准。为了进行验证,随机抽取了定标准。为了进行验证,随机抽取了100100件为件为样本,测得平均使用寿命为样本,测得平均使用寿命为12451245小时。能否小时。能否说该厂的显像管质量显著高于规定标准?说该厂的显像管质量显著高于规定标准?(=0.05)=0.05)现在学习的是第25页,共43页解:
22、解:H H0 0:1200 1200 质量没有显著超过标准质量没有显著超过标准H H1 1:1200 1200 质量显著超过标准质量显著超过标准已知已知n=100n=100,=300=300,故采用,故采用Z Z统计量验证。统计量验证。本题为右侧检验,本题为右侧检验,=0.05=0.05,Z Z=1.645=1.645因为因为ZZZZZZ,Z Z值落在拒绝域中,所以拒绝原假设,值落在拒绝域中,所以拒绝原假设,即不能说该批食品不能出厂。即不能说该批食品不能出厂。现在学习的是第38页,共43页 对消费者的一项调查表明,对消费者的一项调查表明,17%的人早餐饮的人早餐饮料是牛奶。某城市的牛奶生产商认
23、为,该城市的料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法,人早餐饮用牛奶的比例更高。为验证这一说法,生产商随机抽取由生产商随机抽取由250人组成的一个随机样本,人组成的一个随机样本,其中其中60人早餐饮用牛奶。在人早餐饮用牛奶。在=0.05显著性水平显著性水平下,检验该生产商的说法是否属实?下,检验该生产商的说法是否属实?现在学习的是第39页,共43页方差的卡方差的卡方方(2)检验检验1.检验一个总体的方差或标准差检验一个总体的方差或标准差2.假设总体近似服从正态分布假设总体近似服从正态分布3.检验统计量检验统计量样本方差样本方差假设的总体方差假设的总体方
24、差现在学习的是第40页,共43页【例例】某厂商生产出一种新型的某厂商生产出一种新型的饮料装瓶机器,按设计要求,该饮料装瓶机器,按设计要求,该机器装一瓶一升机器装一瓶一升(1000cm3)的饮的饮料误差上下不超过料误差上下不超过1cm3。如果。如果达到设计要求,表明机器的稳定达到设计要求,表明机器的稳定性非常好。现从该机器装完的产性非常好。现从该机器装完的产品中随机抽取品中随机抽取25瓶,分别进行瓶,分别进行测定测定(用样本减用样本减1000cm3),得到,得到如下结果。如下结果。检验该机器的性能是检验该机器的性能是否达到设计要求否达到设计要求 (=0.05)0.3-0.4-0.71.4-0.6
25、-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品双侧检验双侧检验现在学习的是第41页,共43页解:解:H0:2=1H1:2 1 =0.05df=25-1=24临界值临界值(s):统计量统计量:在在 =0.05的水平上不拒绝的水平上不拒绝H0可以认为该机器的性能达到可以认为该机器的性能达到设计要求。设计要求。2 220 0039.3639.3639.3612.4012.4012.40 /2=0.025/2=0.025/2=0.025决策决策:结论结论:现在学习的是第42页,共43页感感谢谢大大家家观观看看现在学习的是第43页,共43页