《第七章假设检验.ppt》由会员分享,可在线阅读,更多相关《第七章假设检验.ppt(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章第七章 假设检验假设检验 n第一节第一节假设检验概述假设检验概述n第二节第二节总体参数检验总体参数检验n第三节第三节卡方检验卡方检验n参数估计是利用样本信息推断未知的总体参数,参数估计是利用样本信息推断未知的总体参数,而假设检验是先对总体参数提出一个假设,然后利而假设检验是先对总体参数提出一个假设,然后利用样本信息判断这一假设是否成立。用样本信息判断这一假设是否成立。1引言引言H0(原假设):某个人从来没有撒过慌H1(备择假设):这个人说过谎证明:他必须出示从小到大每一时刻的录像,所有书写的东西等等,还要证明这些物证是完全的、真实的、没有间断的,即使找到一些证人,比如他的同学、家人和同事
2、来证明,那也只能证明在场的证人在他人生中某些片段没有听到他骂人。但是,反过来,如果要证明这个人骂过人很容易,只要又一次被抓住就足够了。2引言引言n结论:结论:企图肯定什么事情很难,而否定就容企图肯定什么事情很难,而否定就容易得多易得多。(还记得上次那个例子吗?两个人(还记得上次那个例子吗?两个人住一起,其中有一个人病了,另一个人天天住一起,其中有一个人病了,另一个人天天给他熬药还端到他床前,三个月过去了,突给他熬药还端到他床前,三个月过去了,突然有一天那个人忙得很,把药熬好了就对卧然有一天那个人忙得很,把药熬好了就对卧病在床的人说,你自己去喝吧,卧病的人心病在床的人说,你自己去喝吧,卧病的人心
3、里想:里想:“这个人怎么这么坏呢?这个人怎么这么坏呢?”,他倒忘,他倒忘了这个人对他的好,了这个人对他的好,记住一个人的好总比记记住一个人的好总比记住一个人的坏好住一个人的坏好,有时候想想,老师就像端,有时候想想,老师就像端药的人,学生就是喝药的人,良药苦口,我药的人,学生就是喝药的人,良药苦口,我也许一直是你们背后说你们的那个烂人,也许一直是你们背后说你们的那个烂人,老老师也是弱势群体啊!)师也是弱势群体啊!)3第一节第一节 假设检验概述假设检验概述n一、假设检验的基本概念一、假设检验的基本概念n假设检验是统计推断的另一种方式,它与区假设检验是统计推断的另一种方式,它与区间估计的差别主要在于
4、:区间估计是用给定间估计的差别主要在于:区间估计是用给定的大概率推断出的大概率推断出总体参数的范围总体参数的范围,而假设检,而假设检验是以验是以小概率小概率为标准,目的是为了决定一个为标准,目的是为了决定一个关于关于总体特征总体特征的定量的断言(比如一个假设)的定量的断言(比如一个假设)是否真实是否真实。假设检验与区间估计结合起来,。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数类:一类是参数假设检验,另一类是非参数假设检验。本章主要讨论参数假设检验。假设检验。本章主要讨论参数假设检验。4n小概率原
5、理小概率原理(某个人从来没有撒过慌):即):即指概率很小的事件在一次试验中实际上不可指概率很小的事件在一次试验中实际上不可能出现。这种事件称为能出现。这种事件称为“实际不可能事件实际不可能事件”。H0(原假设)为小概率事件(原假设是为了被否定的)接受域H1(被择假设)为了被肯定(1-)拒绝域在假设检验中,规定一个小概率的界限(01),把概率不超过的事件看成是不可能事件。事件出现的概率越少,否定“该事件在一次事件中发生”这一现象就越有说服力。5假设检验的基本形式假设检验的基本形式n(一)双侧检验(一)双侧检验n(二)单侧检验(二)单侧检验6显著水平与拒绝域显著水平与拒绝域7双侧检验双侧检验n一个
6、著名的医生声称有一个著名的医生声称有75%的女性所穿的鞋的女性所穿的鞋子过小,一个研究组织对子过小,一个研究组织对356名女性进行了研名女性进行了研究,发现其中有究,发现其中有313名妇女所穿的号码至少小名妇女所穿的号码至少小一号。你对这个医生的论断有何看法?一号。你对这个医生的论断有何看法?n分析:这是一个双侧检验的问题。我们所关分析:这是一个双侧检验的问题。我们所关心的是:穿鞋子过少的女性比例与心的是:穿鞋子过少的女性比例与75%是否是否有显著差异。此时,可作如下假设:有显著差异。此时,可作如下假设:nH0:=75%vs H1:75%/21/2-Z/2 Z/28单侧检验(下侧检验)单侧检验
7、(下侧检验)n已知番茄罐头中,维生素已知番茄罐头中,维生素C含量服从正态含量服从正态n分布。按照规定,维生素分布。按照规定,维生素C的含量不得的含量不得n少于少于21毫克,现从一批罐头中抽取毫克,现从一批罐头中抽取17n罐,计算得维生素罐,计算得维生素C的平均值为的平均值为23毫克。毫克。n问:该批罐头维生素问:该批罐头维生素C的含量是否合格?的含量是否合格?n分析:这个题目中我们关心的是罐头中维生素分析:这个题目中我们关心的是罐头中维生素C的含的含量是否低于规定标准量是否低于规定标准21毫克,因此属于下侧检验的毫克,因此属于下侧检验的问题。应提出如下建设:问题。应提出如下建设:Z 0 1-下
8、侧检验的概率分布9单侧检验(下侧检验)单侧检验(下侧检验)n某厂有一批产品,须经检验合格才能出厂某厂有一批产品,须经检验合格才能出厂n按照规定,次品率不能超过按照规定,次品率不能超过2%。今这批。今这批n产品中任意抽取产品中任意抽取10件,发现有件,发现有1件次品。件次品。n问:这批产品是否合格?问:这批产品是否合格?n分析:题目关心的是:这批产品是否合格,分析:题目关心的是:这批产品是否合格,n等同于检验该批产品的次品率是否高于等同于检验该批产品的次品率是否高于n规定值规定值2%,因此属于上侧检验问题。应作以下假设:,因此属于上侧检验问题。应作以下假设:1-上侧检验的概率分布 0 Z10二、
9、二、两种类型的错误两种类型的错误 接受接受拒绝拒绝真实真实判断正确判断正确(1-)弃真错误弃真错误(第一第一类错误或类错误或错误错误)不真实不真实取伪错误取伪错误(第二类第二类错误或错误或错误错误)判断正确判断正确(1-)两类错误发生的概率 与之间是此消彼长的关系11两类错误两类错误在一定概率(小概率,=5%,犯第一类错误概率,“去真”),我们在要求“存伪”(第二类错误)的概率尽量减少。无论我们拒绝还是不拒绝原假设,都可能犯错误,并且,在样本量一定的情况,两类错误不可能同时减少。使和同时减少方法是增大样本容量。12n例例1:消费者协会接到消费者投诉,指控品牌:消费者协会接到消费者投诉,指控品牌
10、纸包装饮料存在容量不足,有欺骗消费者之纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为嫌。包装上标明的容量为250毫升。消费者协毫升。消费者协会从市场上随机抽取会从市场上随机抽取50盒该品牌纸包装饮品,盒该品牌纸包装饮品,测试发现平均含量为测试发现平均含量为248毫升,小于毫升,小于250毫升。毫升。这是生产中正常的波动,还是厂商的有意行这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者饮料厂商欺骗了消费者呢?呢?13n消费者协会实际要进行的是一项统计检验工消费者协会实际要进行的是一项统计检验工作。
11、检验总体平均作。检验总体平均=250是否成立。这就是一是否成立。这就是一个个原假设原假设(nullhypothesis),通常用,通常用表示,表示,即:即:=25014n与原假设对立的是备择假设与原假设对立的是备择假设(alternativehypothesis),备选假设是在原假设被否定时,备选假设是在原假设被否定时另一种可能成立的结论。备选假设比原假设另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期还重要,这要由实际问题来确定,一般把期望出现的结论作为备选假设。望出现的结论作为备选假设。15n构造一个统计量来决定是构造一个统计量来决定是“接受原假设,拒绝备选假接
12、受原假设,拒绝备选假设设”,还是,还是“拒绝原假设,接受备选假设拒绝原假设,接受备选假设”。对不同的对不同的问题,要选择不同的检验统计量。检验统计量确定问题,要选择不同的检验统计量。检验统计量确定后,就要利用该后,就要利用该统计的分布统计的分布以及由实际问题中所确以及由实际问题中所确定的显著性水平,来进一步确定检验统计量拒绝原定的显著性水平,来进一步确定检验统计量拒绝原假设的取值范围,即拒绝域。在给定的显著性水平假设的取值范围,即拒绝域。在给定的显著性水平下,检验统计量的可能取值范围被分成两部分:小下,检验统计量的可能取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超概率区域
13、与大概率区域。小概率区域就是概率不超过显著性水平过显著性水平的区域,是原假设的拒绝区域;大概的区域,是原假设的拒绝区域;大概率区域是概率为率区域是概率为1-的区域,是原假设的接受区域。的区域,是原假设的接受区域。16三、检验功效三、检验功效n在犯第一类错误概率得到控制的条件下,犯在犯第一类错误概率得到控制的条件下,犯取伪错误的概率也要尽可能地小取伪错误的概率也要尽可能地小(越少越好越少越好),或者说,不取伪的概率,或者说,不取伪的概率1-应尽可能增大。应尽可能增大。1-越大,意味着当原假设不真实时,检验判越大,意味着当原假设不真实时,检验判断出原假设不真实的概率越大,检验的判别断出原假设不真实
14、的概率越大,检验的判别能力就越好;能力就越好;1-越小,意味着当原假设不真越小,意味着当原假设不真实时,检验结论判断出原假设不真实的概率实时,检验结论判断出原假设不真实的概率越小,检验的判别能力就越差。可见越小,检验的判别能力就越差。可见1-是反是反映统计检验判别能力大小的重要标志,我们映统计检验判别能力大小的重要标志,我们称之为检验功效或检验力。称之为检验功效或检验力。17n用单侧检验还是双侧检验,使用左侧检验还用单侧检验还是双侧检验,使用左侧检验还是右侧检验,决定于备选假设中的不等式形是右侧检验,决定于备选假设中的不等式形式与方向。与式与方向。与“不相等不相等”对应的是双侧检验,对应的是双
15、侧检验,与与“小于小于”相对应的是左侧检验,与相对应的是左侧检验,与“大于大于”相对应的是右侧检验。相对应的是右侧检验。18二、参数检验二、参数检验n参数检验都是先对样本所属总体的性质作出参数检验都是先对样本所属总体的性质作出若干的假定,或对总体的分布形状加以限定,若干的假定,或对总体的分布形状加以限定,然后对总体的有关参数情况进行统计假设检然后对总体的有关参数情况进行统计假设检验。因此,参数检验又称为限定分布检验。验。因此,参数检验又称为限定分布检验。如在总体服从正态分布条件下,对其均值进如在总体服从正态分布条件下,对其均值进行检验。下面通过具体例子来说明参数检验行检验。下面通过具体例子来说
16、明参数检验方法。方法。19n在例在例1中,按历史资料,总体的标准差是中,按历史资料,总体的标准差是4毫毫升。我们通过检验总体均值是否等于升。我们通过检验总体均值是否等于250毫升,毫升,来判断饮料厂商是否欺骗了消费者。程序如来判断饮料厂商是否欺骗了消费者。程序如下:下:20n第第一步:确定原假设与备选假设。一步:确定原假设与备选假设。n:=250;:250n以上的备选假设是总体均值小于以上的备选假设是总体均值小于250毫升,因毫升,因为消费者协会希望通过样本数据推断出厂商为消费者协会希望通过样本数据推断出厂商的欺骗行为的欺骗行为(大于大于250毫升一般不会发生毫升一般不会发生)。因。因此使用左
17、侧检验。此使用左侧检验。21n第二步:构造出检验统计量。第二步:构造出检验统计量。n我们知道,如果总体的标准差已知,则正态我们知道,如果总体的标准差已知,则正态总体总体(正常情况下,生产饮料的容量服从正态正常情况下,生产饮料的容量服从正态分布分布)的抽样平均数,也服从正态分布,对它的抽样平均数,也服从正态分布,对它进行标准化变换,可得到:进行标准化变换,可得到:nn可用可用z作为检验统计量。作为检验统计量。22n第三步:确定显著性水平,确定拒绝域。第三步:确定显著性水平,确定拒绝域。n通常显著水平由实际问题确定,我们这里取通常显著水平由实际问题确定,我们这里取=0.05,左侧检验,拒绝域安排在
18、左边,查标,左侧检验,拒绝域安排在左边,查标准正态分布表得临界值:准正态分布表得临界值:n-=-1.645,拒绝域是,拒绝域是z-1.645。23n第四步:计算检验统计量的数值。第四步:计算检验统计量的数值。n样本平均数样本平均数,n=50,代入检验统计量得:代入检验统计量得:24n第五,根据这个实现值计算第五,根据这个实现值计算p值。值。-z=-1.645,拒绝域是,拒绝域是z20(岁)(岁)n根据自由度根据自由度n=10-1=9,=0.05,查查t分布表得,分布表得,t0.05=1.8331.因为因为tt0.05,所以拒绝零假设,可以认为,所以拒绝零假设,可以认为该城市平均初婚年龄已超过该
19、城市平均初婚年龄已超过20岁。岁。29趁热打铁趁热打铁n某厂采用自动包装机分装产品,假定每包产某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为品的重量服从正态分布,每包标准重量为1000克。某日随机抽查克。某日随机抽查9包,测得样本平均重包,测得样本平均重量为量为986克,样本标准差为克,样本标准差为24克。试问在克。试问在0.05的检验水平上,能否认为这天自动包装机工的检验水平上,能否认为这天自动包装机工作正常?作正常?30总体成数的检验总体成数的检验 n当样本容量较大时当样本容量较大时,下列统计量服从标准正,下列统计量服从标准正态分布:态分布:nn上式中,上式中,
20、代表总体的成数,代表总体的成数,p代表样本的成代表样本的成数。数。n以上的以上的z统计量可以用作总体成数检验的检验统计量可以用作总体成数检验的检验统计量。统计量。31n例例2:某企业声明有:某企业声明有30%以上的消费者对其产以上的消费者对其产品质量满意。如果随机调查品质量满意。如果随机调查600名消费者,表名消费者,表示对该企业产品满意的有示对该企业产品满意的有220人。试在显著性人。试在显著性水平水平=0.05下,检验调查结果是否支持企业的下,检验调查结果是否支持企业的自我声明。自我声明。32n解:第一步:作出假设。解:第一步:作出假设。n:=30%,:30%。n以上的备选假设是企业自我声
21、明的结论,我以上的备选假设是企业自我声明的结论,我们希望该企业说的是实话。因此使用右侧检们希望该企业说的是实话。因此使用右侧检验。验。33n第二步:构造第二步:构造z检验统计量。检验统计量。n第三步:确定拒绝域。第三步:确定拒绝域。n显著水平显著水平=0.05,查标准正态分布表得临界值:,查标准正态分布表得临界值:=1.645,拒绝域是,拒绝域是z1.645。34n第四步:计算检验统计量的数值。第四步:计算检验统计量的数值。n样本成数样本成数p=220/600=0.37,总体假设的成数,总体假设的成数=0.3,代入代入z检验统计量得:检验统计量得:35n第五步:判断。第五步:判断。n检验统计量
22、的样本取值检验统计量的样本取值z=3.51.645,落入拒,落入拒绝域。拒绝原假设,接受备选假设,认为样绝域。拒绝原假设,接受备选假设,认为样本数据证明该企业声明属实。本数据证明该企业声明属实。36趁热打铁趁热打铁n根据某社区根据某社区100户家庭的抽样调查,家庭收入户家庭的抽样调查,家庭收入中用来购买食品的支出比例为中用来购买食品的支出比例为40%,试问:,试问:有关家庭收入中用来购买食品的支出比例为有关家庭收入中用来购买食品的支出比例为33%的说法是否成立?(的说法是否成立?(=0.05)37三、三、p-值检验值检验np-值检验就是通过计算值检验就是通过计算p-值,再将它与显著性值,再将它
23、与显著性水平水平作比较,决定拒绝还是接受原假设。所作比较,决定拒绝还是接受原假设。所谓谓p-值就是拒绝原假设所需的最低显著性水平。值就是拒绝原假设所需的最低显著性水平。p-值判断的原则是:如果值判断的原则是:如果p-值小于给定的显著值小于给定的显著性水平性水平,则拒绝原假设;否则,接受原假设。,则拒绝原假设;否则,接受原假设。或者,更直观来说就是:如果或者,更直观来说就是:如果p-值很小,拒绝值很小,拒绝原假设,原假设,p-值很大,接受原假设。请大家注意值很大,接受原假设。请大家注意的是这里的的是这里的p-值是指概率,不要与成数指标相值是指概率,不要与成数指标相混淆。混淆。38nz检验的检验的
24、p-值:值:n检验统计量为检验统计量为z统计量的统计量的p-值计算公式,值计算公式,表示表示检验统计量的抽样数据,则检验统计量的抽样数据,则p-值的计算方法如值的计算方法如下:下:n如果:如果:,p-值值=2n如果:如果:,p-值值=n如果:如果:,p-值值=39n例例3:利用:利用p-值检验重新检验例值检验重新检验例1。n解:解:n第一、第二步与例第一、第二步与例1完全相同,故省略之。完全相同,故省略之。n第三步:计算样本统计的数值。第三步:计算样本统计的数值。n样本平均数样本平均数,n=50,代入检验统计量,代入检验统计量得:得:40n第四步:计算第四步:计算p-值。值。n使用左侧检验,使
25、用左侧检验,p-值值=。查标准正态。查标准正态分布表得:分布表得:np-值值=1-F(3.54)/2=(1-0.9998)/2=0.000141n第五步:判断。第五步:判断。np-值小于给出的显著性水平值小于给出的显著性水平(0.05),拒绝原假,拒绝原假设,接受备选假设,与例设,接受备选假设,与例1的结论相同。的结论相同。42n之前的学习一直是研究一个变量(即单变量)之前的学习一直是研究一个变量(即单变量)的分析方法,也就是把总体看作是一维的随的分析方法,也就是把总体看作是一维的随机变量,我们已经了解了如何收集数据、使机变量,我们已经了解了如何收集数据、使用集中和离散趋势等指标对变量进行描述
26、,用集中和离散趋势等指标对变量进行描述,以及运用抽样技术对总体进行参数估计等推以及运用抽样技术对总体进行参数估计等推断方法,那么双变量之间的关系怎么样了?断方法,那么双变量之间的关系怎么样了?是强还是弱啊?下面研究双变量之间的相关是强还是弱啊?下面研究双变量之间的相关关系。关系。检验43统计量是用来测定列联表中观测值和期望频数之间的差距,即用于检验列联表中变量之间是否存在显著性差异,或用于检验变量之间是否独立。统计量的公式是:检验44 步骤1:求(观察值-期望频数)步骤2:将(观察值-期望频数)求平方 步骤3:将平方结果:(观察值-期望频数)2 除 以期望频数 步骤4:将步骤三的结果加总解:(
27、1)提出假设如果不存在差异,男生与女生选择学科的比例应该是一致的。于是原假设和备择假设分别为:H0:在高中生总体中,性别与学科选择之间不相关:在高中生总体中,性别与学科选择之间不相关H1:性别与学科之间有相关关系:性别与学科之间有相关关系计算 统计量的步骤:45n性别与学科的关系(频数)性别与学科的关系(频数)女生男生总计文科理科6832335710189总计10090190检验性别与学科的期望频数:性别与学科的期望频数:女生男生文科 5348理科4742(2)计算假设检验的统计量46(3)检验统计显著性)检验统计显著性检验查 分布表,在自由度=1那一行,从样本数据算出的 统计量19.0772,比=0.005的临界值7.879要大,我们有足够的证据证明这个样本这个样本来自两个变量相关的总体,即拒绝零假设,并且可以推断,对于整个总体来说,性别与学科选择的确是相关的。47趁热打铁趁热打铁n下列是某大学生经管系下列是某大学生经管系386名学生专业选择的问卷资名学生专业选择的问卷资料:料:女生男生会计6856工商管理4091人力资源管理616经济559(1)根据这些数据构造一个列联表(2)进行卡方检验48