《应用统计学第六章参数假设检验幻灯片.ppt》由会员分享,可在线阅读,更多相关《应用统计学第六章参数假设检验幻灯片.ppt(126页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、应用统计学第六章参数假设检验第1页,共126页,编辑于2022年,星期六假设检验假设检验n假设检验假设检验是推论统计的重要内容,是先对总体的未知数量特征作出是推论统计的重要内容,是先对总体的未知数量特征作出某种假设,然后抽取样本,利用样本信息对假设的正确性进行判某种假设,然后抽取样本,利用样本信息对假设的正确性进行判断的过程。断的过程。n参数假设参数假设是是对总体参数的一种看法。总对总体参数的一种看法。总体参数包括总体均值、总体比例、总体体参数包括总体均值、总体比例、总体方差等。分析之前必需陈述。方差等。分析之前必需陈述。n参数假设检验是参数假设检验是通过样本信息对关于总体参通过样本信息对关于
2、总体参数的某种假设合理与否进行检验的过程。即数的某种假设合理与否进行检验的过程。即先对未知的总体参数的取值提出某种假设,先对未知的总体参数的取值提出某种假设,然后抽取样本,利用样本信息去检验这个假然后抽取样本,利用样本信息去检验这个假设是否成立。如果成立就接受这个假设,如设是否成立。如果成立就接受这个假设,如果不成立就放弃这个假设。果不成立就放弃这个假设。我认为该企业生产的零件我认为该企业生产的零件我认为该企业生产的零件我认为该企业生产的零件的平均长度为的平均长度为的平均长度为的平均长度为4 4厘米厘米厘米厘米!第2页,共126页,编辑于2022年,星期六第3页,共126页,编辑于2022年,
3、星期六一、假设检验问题的提出一、假设检验问题的提出二、假设检验的一般步骤二、假设检验的一般步骤第第6.1节节 假设检验的基本概念假设检验的基本概念第4页,共126页,编辑于2022年,星期六一、假设检验问题的提出一、假设检验问题的提出引引例例(女女士士品品茶茶问问题题)一一种种饮饮料料由由牛牛奶奶与与茶茶按按一一定定比比例例混混合合而而成成,可可以以先先倒倒茶茶后后倒倒牛牛奶奶(记记为为TM)或或反反过过来来(MT)。某某女女士士声声称称,她她可可以以鉴鉴别别是是 TM 还还是是 MT。设设计计如如下下试试验验,来来检检验验她她的的说说法法是是否否可可信信。准准备备 8 杯杯饮饮料料,TM 和
4、和 MT 各各半半,把把它它们们随随机机的的排排成成一一列列让让该该女女士士品品尝尝,并并告告诉诉她她 TM 和和 MT 各各有有 4 杯杯,然然后后请请她她指指出出哪哪 4 杯杯是是 TM。结果她都说对了。结果她都说对了。请你判断该女士是否有鉴别力!请你判断该女士是否有鉴别力!若该女士只说对了若该女士只说对了 3 杯,又会得到怎样的结论?杯,又会得到怎样的结论?第5页,共126页,编辑于2022年,星期六参数假设检验举例参数假设检验举例例例1:根据:根据1989年的统计资料,某地女性新生儿的平均体年的统计资料,某地女性新生儿的平均体重为重为3190克克。为判断该地。为判断该地1990年的女性
5、新生儿体重与年的女性新生儿体重与1989年相比有无显著差异,从该地年相比有无显著差异,从该地1990年的女性新生儿中年的女性新生儿中随机抽取随机抽取30人,测得其平均体重为人,测得其平均体重为3210克克。从样本数据。从样本数据看,看,1990年女新生儿体重比年女新生儿体重比1989年略高,但这种差异可年略高,但这种差异可能是由于抽样的随机性带来的,也许这两年新生儿的体能是由于抽样的随机性带来的,也许这两年新生儿的体重并没有显著差异。究竟是否存在显著差异?可以先假重并没有显著差异。究竟是否存在显著差异?可以先假设这两年新生儿的体重没有显著差异,然后利用样本信设这两年新生儿的体重没有显著差异,然
6、后利用样本信息检验这个假设能否成立。息检验这个假设能否成立。这是一个关于总体均值的假设这是一个关于总体均值的假设检验问题。检验问题。第6页,共126页,编辑于2022年,星期六参数假设检验举例参数假设检验举例例例2:某公司进口一批钢筋,根据要求,钢筋的平:某公司进口一批钢筋,根据要求,钢筋的平均拉力强度不能低于均拉力强度不能低于2000克,而供货商强调其产克,而供货商强调其产品的平均拉力强度已达到了这一要求,这时需要进品的平均拉力强度已达到了这一要求,这时需要进口商对供货商的说法是否真实作出判断。进口商可口商对供货商的说法是否真实作出判断。进口商可以先假设该批钢筋的平均拉力强度不低于以先假设该
7、批钢筋的平均拉力强度不低于2000克,克,然后用样本的平均拉力强度来检验假设是否正确。然后用样本的平均拉力强度来检验假设是否正确。这也是一个关于总体均值的假设检验问题。这也是一个关于总体均值的假设检验问题。第7页,共126页,编辑于2022年,星期六参数假设检验举例参数假设检验举例例例3:某种大量生产的袋装食品,按规定每袋重量不得少于:某种大量生产的袋装食品,按规定每袋重量不得少于250克,现从一批该种食品中任意抽取克,现从一批该种食品中任意抽取50袋,发现有袋,发现有6袋重量低于袋重量低于250克。若规定食品不符合标准的比例克。若规定食品不符合标准的比例达到达到5就不得出厂,问该批食品能否出
8、厂。可以就不得出厂,问该批食品能否出厂。可以先假设该批食品的不合格率不超过先假设该批食品的不合格率不超过5,然后用样本,然后用样本不合格率来检验假设是否正确。不合格率来检验假设是否正确。这是一个关于总体比例这是一个关于总体比例的假设检验问题。的假设检验问题。第8页,共126页,编辑于2022年,星期六假设检验的思想:假设检验的思想:1、有一个明确的命题或假设、有一个明确的命题或假设 H;2、当、当 H 成立时,考虑某一变量成立时,考虑某一变量 X 的性质,在女士品茶的性质,在女士品茶问题中,考虑问题中,考虑 X 为该女士说对的杯数,为该女士说对的杯数,注意此时注意此时 X 的分的分布已知布已知
9、;3、以、以 x 表示表示 X 的观测值,考虑的观测值,考虑 P(X=x)=px,px 越小,越小,试验结果越不利于试验结果越不利于 H;4、根据规定的小概率事件,做出最后的决策。、根据规定的小概率事件,做出最后的决策。第9页,共126页,编辑于2022年,星期六假设检验的基本原理假设检验的基本原理n假设检验所依据的基本原理是小概率原理。假设检验所依据的基本原理是小概率原理。n什么是小概率?什么是小概率?n概率是概率是01之间的一个数,因此小概率就是接之间的一个数,因此小概率就是接近近0的一个数的一个数n著名的英国统计家著名的英国统计家Ronald Fisher 把把20分之分之1作作为标准,
10、也就是为标准,也就是0.05,从此,从此0.05或比或比0.05小的小的概率都被认为是小概率概率都被认为是小概率nFisher没有任何深奥的理由解释他为什么选择没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的,只是说他忽然想起来的第10页,共126页,编辑于2022年,星期六什么是小概率原理?什么是小概率原理?n小概率原理小概率原理发生概率很小的随机事件(小概率事件)在一次发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。实验中几乎是不可能发生的。n根据这一原理,可以先假设总体参数的某项取值为真,也就根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其
11、发生的可能性很大,然后抽取一个样本进行观察,是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。疑和拒绝原假设;否则不能拒绝原假设。n检验中使用的小概率是检验前人为指定的。检验中使用的小概率是检验前人为指定的。第11页,共126页,编辑于2022年,星
12、期六如果假设这批产品的次品率如果假设这批产品的次品率P4,则可计算事件,则可计算事件“抽抽10件产品有件产品有4件次品件次品”的出现概率为:的出现概率为:小概率原理举例:小概率原理举例:n某工厂质检部门规定该厂产品次品率不超过某工厂质检部门规定该厂产品次品率不超过4方能出厂。方能出厂。今从今从1000件产品中抽出件产品中抽出10件,经检验有件,经检验有4件次品,问这批件次品,问这批产品是否能出厂产品是否能出厂?可见,概率是相当小的,可见,概率是相当小的,1万次实验中可能出现万次实验中可能出现4次,然而概率次,然而概率如此小的事件,在一次实验中居然发生了,这是不合理的,而不合如此小的事件,在一次
13、实验中居然发生了,这是不合理的,而不合理的根源在于假设次品率理的根源在于假设次品率P4,因而认为假设次品率,因而认为假设次品率P4是不能是不能成立的,故按质检部门的规定,这批产品不能出厂。成立的,故按质检部门的规定,这批产品不能出厂。第12页,共126页,编辑于2022年,星期六注意:注意:在假设检验中在假设检验中“拒绝拒绝”和和“接受接受”反映了决策者在反映了决策者在所面对的样本证据下,对该命题所采取的一种态度、倾向所面对的样本证据下,对该命题所采取的一种态度、倾向性,而不是在逻辑上性,而不是在逻辑上“证明证明”该命题正确与否!该命题正确与否!第13页,共126页,编辑于2022年,星期六假
14、设检验的思想假设检验的思想企图肯定什么事情很困难,而否定却企图肯定什么事情很困难,而否定却相对容易得多!相对容易得多!概率论中的反证法!(依据小概率事件原理)概率论中的反证法!(依据小概率事件原理)第14页,共126页,编辑于2022年,星期六分析分析:例例1、某厂生产的合金强度服从正态分布某厂生产的合金强度服从正态分布N(,16),其中其中的的设设计值为计值为不低于不低于110(Pa).为为保保证质证质量量,该该厂每天都要厂每天都要对对生生产产情况情况例行例行检查检查,以判断生以判断生产产是否正常是否正常进进行行,即即该合金的平均强度不该合金的平均强度不低于低于110(Pa).某天从生产中随
15、机抽取某天从生产中随机抽取 25 块合金块合金,测得强度值为测得强度值为 x1,.,x25,其平均值为其平均值为 =108(Pa),问问当日生产是否正常当日生产是否正常?1、本本题题要要求求根根据据样样本本的的信信息息对对命命题题“合合金金的的平平均均强强度度不不低低于于110(Pa)”作出判断作出判断.因此是因此是假设检验问题假设检验问题.第15页,共126页,编辑于2022年,星期六2、命命题题“合合金金的的平平均均强强度度不不低低于于110(Pa)”正正确确与与否否仅仅涉涉及及参参数数,因因此此该该命命题题是否正确将涉及如下两个参数集合:是否正确将涉及如下两个参数集合:命命题题成成立立对
16、对应应于于“0 0”,命命题题不不成成立立对对应应于于“1 1”。称称这这两两个非空参数集合为个非空参数集合为(统计)假设。(统计)假设。第16页,共126页,编辑于2022年,星期六“假设不正确假设不正确”拒绝该假设拒绝该假设;“假设正确假设正确”不拒绝该假设不拒绝该假设 。3、目的是利用所给总体目的是利用所给总体N(,16)和和样样本均本均值值 =108(Pa)来来判断判断假假设设“0 0”是否成立是否成立。“判断判断”在在统计统计学中称学中称为为检验检验或或检验检验准准则则。此准。此准则则是在解决是在解决问题时问题时首先要确定的,有了首先要确定的,有了它,它,检验结检验结果有两种:果有两
17、种:第17页,共126页,编辑于2022年,星期六例例1、某厂生产的合金强度服从正态分布某厂生产的合金强度服从正态分布N(,16),其中其中的的设设计值为计值为不低于不低于110(Pa).为为保保证质证质量量,该该厂每天都要厂每天都要对对生生产产情况情况例行例行检查检查,以判断生以判断生产产是否正常是否正常进进行行,即即该合金的平均强度不该合金的平均强度不低于低于110(Pa).某天从生产中随机抽取某天从生产中随机抽取 25 块合金块合金,测得强度值为测得强度值为 x1,.,x25,其平均值为其平均值为 =108(Pa),问问当日生产是否正常当日生产是否正常?二、假设检验的一般步骤二、假设检验
18、的一般步骤第18页,共126页,编辑于2022年,星期六1 建立建立假设假设在假在假设检验中,把被中,把被检验的假的假设称称为原假原假设,记为记为也称零假也称零假设,通常将,通常将不不应轻易加以否定的假易加以否定的假设作作为原假原假设。当。当 H0 被拒被拒绝时而接受的假而接受的假设称称为备择假假设。记为 也称也称为对立假立假设。例如:例例如:例 1 的的统计假假设分分别为表示表示 H0 对对 H1 的假设检验问题的假设检验问题.简记为第19页,共126页,编辑于2022年,星期六2 检验法则检验法则-选择检验统计量,给出拒绝域形式选择检验统计量,给出拒绝域形式 由样本对原假设进行判断需要通过
19、一个统计量来完成,称由样本对原假设进行判断需要通过一个统计量来完成,称之为之为检验统计量。检验统计量。使原假设被拒绝的样本观测值所在的区域称为使原假设被拒绝的样本观测值所在的区域称为拒绝域(或否拒绝域(或否定域、临界域)定域、临界域).它是样本空间的一个子集,记为它是样本空间的一个子集,记为 W。如例如例1中中,要检验的假设是正态总体的均值,在方差已知时,要检验的假设是正态总体的均值,在方差已知时,样本均值样本均值 是个很好的检验统计量。是个很好的检验统计量。第20页,共126页,编辑于2022年,星期六 当拒绝域确定后当拒绝域确定后,检验准则依之确定检验准则依之确定:若若(x1,xn)W,则
20、认为则认为 H0 不成立不成立.若若(x1,.,xn),则认为则认为 H0 成立成立;称称 为接受域为接受域.如例如例1中中,若若 110 与样本均值的差过分地大与样本均值的差过分地大,即即 则应拒绝则应拒绝 H0.因此在样本均值的取值中存在一个因此在样本均值的取值中存在一个临界值临界值 c(待定待定),拒绝域应为拒绝域应为第21页,共126页,编辑于2022年,星期六原假设原假设 H0 在客观上只有两种可能在客观上只有两种可能:真、假。真、假。即有下面四种情况:即有下面四种情况:(1)、假设检验的两类错误、假设检验的两类错误 3 选择显著性水平选择显著性水平样本值样本值(x1,xn)也只有两
21、种可能性:属于拒绝域也只有两种可能性:属于拒绝域 W、不属于、不属于 W。1)H0真,而真,而(x1,xn)W;拒绝拒绝H02)H0真,而真,而(x1,xn)W;接受接受H03)H0假,而假,而(x1,xn)W;拒绝拒绝H04)H0假,而假,而(x1,xn)W;接受接受H0第一类错误第一类错误(拒真错误(拒真错误)第二类错误第二类错误(受伪错误)(受伪错误)第22页,共126页,编辑于2022年,星期六记犯第一类错误的概率为记犯第一类错误的概率为,即,即记犯第二类错误的概率为记犯第二类错误的概率为,即,即 =P拒绝拒绝H0|H0为真为真=P(X W),0 =P接受接受H0|H1为真为真=P(X
22、 W),1第23页,共126页,编辑于2022年,星期六 假设检验的两类错误假设检验的两类错误H0为真为真实际情况实际情况决定决定(观测数据情况)(观测数据情况)接受接受H0H0不真不真犯第一类错误犯第一类错误正确正确(不犯第二类错误(不犯第二类错误)正确正确(不犯第一类错误)(不犯第一类错误)犯第二类错误犯第二类错误 P拒绝拒绝H0|H0为真为真=,P接受接受H0|H1为真为真=.犯两类错误的概率犯两类错误的概率:拒绝拒绝H0第24页,共126页,编辑于2022年,星期六(2)显著性水平显著性水平 则称该检验是则称该检验是显著性水平为显著性水平为的显著性检验的显著性检验,简称,简称水平为水平
23、为的检验。的检验。如果一个检验满足犯第一类错误的概率如果一个检验满足犯第一类错误的概率,定义定义:设检验问题设检验问题第25页,共126页,编辑于2022年,星期六注:注:水平为水平为的检验就是要求犯第一类错误的概的检验就是要求犯第一类错误的概 率不超过率不超过.一般一般 地取地取=0.05、=0.10或或=0.01。即:犯第一类。即:犯第一类错误的概率是个小概率事件,错误的概率是个小概率事件,小概率事件在一次随机试验小概率事件在一次随机试验中几乎不发生中几乎不发生.若若H0 真真,也即也即,H0 成立下的小概率事件发成立下的小概率事件发生了,那么就认为生了,那么就认为H0不可信而拒绝它不可信
24、而拒绝它.否则就不能否定否则就不能否定H0(只好接受它)(只好接受它).这就是这就是假设检验的基本思想假设检验的基本思想。第26页,共126页,编辑于2022年,星期六4 给出拒绝域给出拒绝域在规定了检验的显著性水平在规定了检验的显著性水平后,根据容量为后,根据容量为n的样本,的样本,按照统计量的理论概率分布规律,可以确定据以判断拒按照统计量的理论概率分布规律,可以确定据以判断拒绝和接受原假设的检验统计量的绝和接受原假设的检验统计量的临界值临界值。临界值临界值将统计量的所有可能取值区间分为两个互不相将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。交的部分,即原假设的
25、拒绝域和接受域。对于正态总体,总体均值的假设检验可有如下图示:对于正态总体,总体均值的假设检验可有如下图示:第27页,共126页,编辑于2022年,星期六正态总体,总体均值假设检验图示:正态总体,总体均值假设检验图示:(1)双侧检验双侧检验设设H0:X X0,H1:X X0,有两个临界值,两个拒绝域,每个拒绝,有两个临界值,两个拒绝域,每个拒绝域的面积为域的面积为/2。也称双尾检验也称双尾检验。双侧检验示意图双侧检验示意图 X0第28页,共126页,编辑于2022年,星期六双侧检验示意图双侧检验示意图(显著性水平与拒绝域(显著性水平与拒绝域)抽样分布抽样分布抽样分布抽样分布H HH000值值值
26、值值值临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域接受域接受域1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平第29页,共126页,编辑于2022年,星期六双侧检验示意图双侧检验示意图(显著性水平与拒绝域(显著性水平与拒绝域)H H0 0值值值值临界值临界值临界值临界值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝
27、域拒绝域拒绝域拒绝域接受域接受域接受域接受域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平观察到观察到观察到观察到的样本的样本的样本的样本统计量统计量统计量统计量第30页,共126页,编辑于2022年,星期六双侧检验示意图双侧检验示意图(显著性水平与拒绝域(显著性水平与拒绝域)H H0 0值值值值临界值临界值临界值临界值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平观察到的观察到的观察到的观察到的样本统计样本统计样本统计样
28、本统计量量量量第31页,共126页,编辑于2022年,星期六双侧检验示意图双侧检验示意图(显著性水平与拒绝域(显著性水平与拒绝域)H H0 0值值值值临界值临界值临界值临界值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平观察到的观察到的观察到的观察到的样本统计样本统计样本统计样本统计量量量量第32页,共126页,编辑于2022年,星期六(2)单侧检验)单侧检验有一个临界值,一个拒绝域,拒绝域的面积为有一个临界值,一个拒绝域,拒绝域的面
29、积为。分为左侧。分为左侧检验和右侧检验两种情况。检验和右侧检验两种情况。单侧检验示意图单侧检验示意图(显著性水平与拒绝域)(显著性水平与拒绝域)H H0 0值值值值临界值临界值临界值临界值 样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第33页,共126页,编辑于2022年,星期六左侧检验左侧检验设设H0:X X0,H1:X X0;临界值和拒绝;临界值和拒绝域均在左侧。域均在左侧。也称下限检验也称下限检验。X0第34页,共126页,编辑于2022年,星期六左侧检验示意图左侧检验示意图(显著性水平与
30、拒绝域(显著性水平与拒绝域)H HH0 00值值值值值值临界值临界值临界值临界值临界值临界值 样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量第35页,共126页,编辑于2022年,星期六左侧检验示意图左侧检验示意图(显著性水平与拒绝域(显著性水平与拒绝域)H HH0 00值值值值值值临界值临界值临界值临界值临界值
31、临界值 样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域接受域接受域抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平观察到的观察到的观察到的观察到的样本统计样本统计样本统计样本统计量量量量第36页,共126页,编辑于2022年,星期六右侧检验右侧检验设设H0:X X0,H1:X X0;临界值和拒绝临界值和拒绝域均在右侧。域均在右侧。也称上限检验也称上限检验。X0第37页,共126页,编辑于2022年,星期六右侧检验示意图右侧检验示意图(显著性水平与拒绝域(显著性水平与拒绝域)H HH0 00值值值值值值临界值临
32、界值临界值临界值临界值临界值 样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量第38页,共126页,编辑于2022年,星期六右侧检验示意图右侧检验示意图(显著性水平与拒绝域(显著性水平与拒绝域)H HH0 00值值值值值值临界值临界值临界值临界值临界值临界值 样本统计量样本统计量样本统计量样本统计量样本统计量样本统
33、计量接受域接受域接受域接受域接受域接受域抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域观察到观察到观察到观察到的样本的样本的样本的样本统计量统计量统计量统计量第39页,共126页,编辑于2022年,星期六4 给出拒绝域给出拒绝域在确定在确定显著性水平后,可以确定检验的拒绝域显著性水平后,可以确定检验的拒绝域W.如在上面例如在上面例1中中,取取=0.05,=0.05,要使对任意的要使对任意的110 有有由于由于g()为为的减函数。只要的减函数。只要又标准正态分布的又标准正态分布的0.05分位数分位数 ,所以,所以即即检验的拒绝域检验的拒绝域或令或
34、令 ,则,则即即 0P155第40页,共126页,编辑于2022年,星期六注:注:确定确定H0与与H1的一般原则的一般原则 :若问题只提出一个假设,且检验的目的仅仅是为了判若问题只提出一个假设,且检验的目的仅仅是为了判别这个假设是否成立,并不同时研究其它假设,则直接取别这个假设是否成立,并不同时研究其它假设,则直接取该假设作为原假设该假设作为原假设 H0 即可即可.在实际问题中,若是问新方法(新材料、新工艺、新在实际问题中,若是问新方法(新材料、新工艺、新配方之类)是否比原方法好,通常将原方法取为配方之类)是否比原方法好,通常将原方法取为“原假设原假设H0”,而将新方法取为,而将新方法取为“备
35、择假设备择假设H1”.且在处理且在处理 H0 时总是偏时总是偏于保守的,在没有证据时不轻易拒绝于保守的,在没有证据时不轻易拒绝 H0.还要考虑数学上的处理方便来设定还要考虑数学上的处理方便来设定 H0 与与 H1.第42页,共126页,编辑于2022年,星期六5 作出判断作出判断有了明确有了明确的拒绝域的拒绝域 W 后,由样本观测值可以做出判断:后,由样本观测值可以做出判断:第43页,共126页,编辑于2022年,星期六假设检验的步骤假设检验的步骤1、提出假设,提出假设,建立建立H H0 0与与H H1 13 3、根据给定显著性水平、根据给定显著性水平,查临界值并确定拒绝域查临界值并确定拒绝域
36、4、作出判断,接受或拒绝原假设作出判断,接受或拒绝原假设.2 2、确定检验统计量及其分布,、确定检验统计量及其分布,并由给定的样本值计算统计量的值并由给定的样本值计算统计量的值 假设假设统计量统计量查表查表判断判断第44页,共126页,编辑于2022年,星期六第45页,共126页,编辑于2022年,星期六第46页,共126页,编辑于2022年,星期六第47页,共126页,编辑于2022年,星期六第48页,共126页,编辑于2022年,星期六第49页,共126页,编辑于2022年,星期六设设 X X N N(2 2),2 2 已知已知,需检验,需检验 :1.H0:0 ;H1:02.构造统计量构造
37、统计量 给定显著性水平给定显著性水平 与样本值与样本值(x x1 1,x x2 2,x xn n)小结:关于小结:关于 的检验(的检验(2 已知)第50页,共126页,编辑于2022年,星期六 4.判断,若判断,若 则拒绝原假设,则拒绝原假设,接受对立假设,认为接受对立假设,认为 0。3.根据根据 ,查临界值查临界值 。第51页,共126页,编辑于2022年,星期六第52页,共126页,编辑于2022年,星期六 已知,故应选择检验统计量已知,故应选择检验统计量由题中条件和计算得:由题中条件和计算得:第53页,共126页,编辑于2022年,星期六第54页,共126页,编辑于2022年,星期六第5
38、5页,共126页,编辑于2022年,星期六第56页,共126页,编辑于2022年,星期六第57页,共126页,编辑于2022年,星期六设设 X X N N(2 2),2 2 未知,需检验未知,需检验 :1.H0:0 ;H1:02.构造统计量构造统计量 t(n-1)给定显著性水平给定显著性水平 与样本值与样本值(x x1 1,x x2 2,x xn n)小结:关于小结:关于 的检验(的检验(2 未知)第58页,共126页,编辑于2022年,星期六4.判断,若判断,若 则拒绝原假设,则拒绝原假设,接受对立假设,认为接受对立假设,认为 0 3.根据根据 ,查临界值查临界值 。第59页,共126页,编
39、辑于2022年,星期六练习:已知某公司生产某种灯管,公司经理称,他们的产品平均使用已知某公司生产某种灯管,公司经理称,他们的产品平均使用寿命为三年,为检验他的说法,随机抽取寿命为三年,为检验他的说法,随机抽取5个灯管。测得寿命个灯管。测得寿命数据为数据为1.3,4.1,4.8,3.4,2.9(单位:年),已知灯管使用寿命服(单位:年),已知灯管使用寿命服从正态分布,请检验经理的说法是否正确?显著水平从正态分布,请检验经理的说法是否正确?显著水平 为为0.05.第60页,共126页,编辑于2022年,星期六第61页,共126页,编辑于2022年,星期六0第62页,共126页,编辑于2022年,星
40、期六注意:注意:P180第63页,共126页,编辑于2022年,星期六改改第64页,共126页,编辑于2022年,星期六第65页,共126页,编辑于2022年,星期六第66页,共126页,编辑于2022年,星期六第67页,共126页,编辑于2022年,星期六第68页,共126页,编辑于2022年,星期六第69页,共126页,编辑于2022年,星期六第70页,共126页,编辑于2022年,星期六第71页,共126页,编辑于2022年,星期六设设 X X N N(2 2),需检验需检验 2 2 :1.H0:H1:2.构造统计量 给定显著性水平给定显著性水平 与样本值与样本值(x x1 1,x x2
41、 2,x xn n)小结:关于小结:关于2 的检验,的检验,未知未知 2=02 2 02第72页,共126页,编辑于2022年,星期六4.判断,若判断,若 则拒绝则拒绝原假设,接受对立假设,认为原假设,接受对立假设,认为 2 023.根据根据 ,查临界值查临界值 。第73页,共126页,编辑于2022年,星期六练习:某种溶液的成分(练习:某种溶液的成分(%)服从正态分布,现由)服从正态分布,现由10个样本观测个样本观测值计算平均值为值计算平均值为0.452,s=0.037,请检验,请检验是否成立?(是否成立?(=0.10)(1)(2)第74页,共126页,编辑于2022年,星期六(4)(3)第
42、75页,共126页,编辑于2022年,星期六接下去接下去,自己完成。自己完成。2.未知均值未知均值,检验检验假假设设:总总体方差体方差202是否成立是否成立第76页,共126页,编辑于2022年,星期六6.2.4 区间估计与假设检验的关系区间估计与假设检验的关系n抽样估计与假设检验都是统计推断的重要内容。参数估计抽样估计与假设检验都是统计推断的重要内容。参数估计是根据样本统计量估计总体参数的真值;假设检验是根据是根据样本统计量估计总体参数的真值;假设检验是根据样本统计量来检验对总体参数的先验假设是否成立。样本统计量来检验对总体参数的先验假设是否成立。区间估计与假设检验的主要区别区间估计与假设检
43、验的主要区别1.区间估计通常求得的是以样本估计值为中心的双侧置信区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验以假设总体参数值为基准,不仅有双区间,而假设检验以假设总体参数值为基准,不仅有双侧检验也有单侧检验;侧检验也有单侧检验;2.区间估计立足于大概率,通常以较大的把握程度(置信水区间估计立足于大概率,通常以较大的把握程度(置信水平)平)1-去保证总体参数的置信区间。而假设检验立足去保证总体参数的置信区间。而假设检验立足于小概率,通常是给定很小的显著性水平于小概率,通常是给定很小的显著性水平去检验对总去检验对总体参数的先验假设是否成立。体参数的先验假设是否成立。第77页,共
44、126页,编辑于2022年,星期六区间估计与假设检验的联系区间估计与假设检验的联系1.区间估计与假设检验都是根据样本信息对总体参数进区间估计与假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风率基础上的推断,推断结果都有一定的可信程度或风险。险。2.对同一问题的参数进行推断,二者使用同一样本、同一对同一问题的参数进行推断,二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。区间估计问统计量、同一分布,因而二者可以相互转换。区间估计问题可以转换成假设问题,假设问题
45、也可以转换成区间估计题可以转换成假设问题,假设问题也可以转换成区间估计问题。区间估计中的置信区间对应于假设检验中的接受区问题。区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。域,置信区间以外的区域就是假设检验中的拒绝域。第78页,共126页,编辑于2022年,星期六用置信区间进行检验用置信区间进行检验 (例题分析例题分析)【例例】一一种种袋袋装装食食品品每每包包的的标标准准重重量量应应为为1000克克。现现从从生生产产的的一一批批产产品品中中随随机机抽抽取取16袋袋,测测得得其其平平均均重重量量为为991克克。已已知知这这种种产产品品重重量量服服从从标
46、标准准差差为为50克克的的正正态态分分布布。试试确确定定这这批批产产品品的的包包装装重重量量是是否否合合格格?(=0.05)双侧检验!双侧检验!双侧检验!双侧检验!香脆香脆香脆香脆香脆香脆蛋卷蛋卷蛋卷蛋卷蛋卷蛋卷第79页,共126页,编辑于2022年,星期六用置信区间进行检验用置信区间进行检验(例题分析例题分析)解:解:提出假设:提出假设:H0:X=1000 H1:X 1000已知:已知:n=16,=50,=0.05双侧检验双侧检验/2/2=0.025 临界值临界值:Z0.025=1.96置信区间为置信区间为决策决策:结论结论:X=1000 在置信区间内,在置信区间内,不拒绝不拒绝H0可以认为
47、这批产品的包装重可以认为这批产品的包装重量合格量合格Z01.96-1.960.025拒绝拒绝 H0拒绝拒绝 H00.025第80页,共126页,编辑于2022年,星期六第87页,共126页,编辑于2022年,星期六第88页,共126页,编辑于2022年,星期六第89页,共126页,编辑于2022年,星期六第90页,共126页,编辑于2022年,星期六第91页,共126页,编辑于2022年,星期六、第92页,共126页,编辑于2022年,星期六第93页,共126页,编辑于2022年,星期六第94页,共126页,编辑于2022年,星期六第95页,共126页,编辑于2022年,星期六第96页,共12
48、6页,编辑于2022年,星期六第97页,共126页,编辑于2022年,星期六第98页,共126页,编辑于2022年,星期六第99页,共126页,编辑于2022年,星期六第100页,共126页,编辑于2022年,星期六第101页,共126页,编辑于2022年,星期六第102页,共126页,编辑于2022年,星期六第103页,共126页,编辑于2022年,星期六第104页,共126页,编辑于2022年,星期六第105页,共126页,编辑于2022年,星期六第106页,共126页,编辑于2022年,星期六第107页,共126页,编辑于2022年,星期六第108页,共126页,编辑于2022年,星期六
49、第109页,共126页,编辑于2022年,星期六第110页,共126页,编辑于2022年,星期六第111页,共126页,编辑于2022年,星期六第112页,共126页,编辑于2022年,星期六第113页,共126页,编辑于2022年,星期六第114页,共126页,编辑于2022年,星期六第115页,共126页,编辑于2022年,星期六第116页,共126页,编辑于2022年,星期六第117页,共126页,编辑于2022年,星期六第118页,共126页,编辑于2022年,星期六第119页,共126页,编辑于2022年,星期六第120页,共126页,编辑于2022年,星期六第121页,共126页,
50、编辑于2022年,星期六第122页,共126页,编辑于2022年,星期六第123页,共126页,编辑于2022年,星期六第124页,共126页,编辑于2022年,星期六第125页,共126页,编辑于2022年,星期六本题也可以直接用正态分布来做,因为在大样本下(np10,n(1p)10),二项分布B(100,0.5)近似服从正态分布。直接按照正态分布来做,此时用的是t统计量,均方差直接用样本求出直接用样本求出s,而不是用不是用p(1p)/n来计算来计算的,与上页近似为正态分布的结果,有所差异。把双尾转化为单尾,t统计值的显著性概率为:0.016/2=0.008,此时,犯错误的概率不超过0.8%