《假设检验4学习.pptx》由会员分享,可在线阅读,更多相关《假设检验4学习.pptx(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、次试验中不发生原理,照样乘车、乘飞机等。2、假设检验问题的提出在用统计学研究自然科学和社会科学问题时,有时提出一个假设,这个假设称为原假设,然后依据小概率事件在一次试验中不发生原理,检验这个假设正确与否。例1 某超市从厂家进货,双方达成协议,如果次品率超过1%,则超市拒收货物,今有一批货物,随机抽取200件检查,发现有次品3件,在显著性水平 下,试问超市是否要接受这批货物?作为超市来说,可以提出一个假设:次品率小于或等于1%,再抽取样本,检验这个假设对不对,若假设成立,就允许这批货物进入超市,相反,若假设不成立,就拒绝这批货物进入超市。现在问题的关键在于如何判断这批货物的次品率是否超过1%,有
2、些同学可能会说可以抽一部分 第1页/共29页货物进行检测一下,看看这部货物次品率是否超过1%,由于你抽取的货物是随机的,因此所抽查货物的次品率也是随机的。为此,我们假定前面的假设是正确的,在这基础上计算题目中的事件A:“随机抽取产品中次品率不超过1%”发生的概率。(1)在(1)式中,z 正好是统计量,并且其分布是标准正态 第2页/共29页分布,计算结果及示意图是 y 0.0044 2.61 x从(1)的计算结果可以看出,在超市提出的假设成立的情况下,随机抽取的200件产品中,有6件是次品的概率为0.0044,显然这是一个小概率事件,认为在一次抽查中不应该发生,现在它发生了,我们怀疑超市提出的假
3、设不应该成立。也就是拒绝这批产品进入超市。在这个例子中,超市提出了假设,通过抽样获得样本数第3页/共29页据和统计量的分布,计算出这个假设成立的概率很小,是小概率事件,再根据小概率事件在一次试验中不发生原理,拒绝了产品进入超市。这个过程就是统计学中重要内容假设检验。3、原假设和备择假设原假设(null hypothesis):指研究者想收集证据予以反驳的假设。通常用 表示。备择假设(alternative hypothesis):指研究者想收集证据予以支持的假设。通常用 表示。例如 在例1中,“次品率小于或等于1%”是超市想反驳的假设,是原假设。它的对立面“次品率大于1%”是超市想支持的假设,
4、是备择假设。4、两类错误和显著性水平 第一类错误:原假设是真的,但在检验中被错误地拒绝了。第二类错误:原假设是假时,没有拒绝而错误地被接受了。第4页/共29页这两类错误之间的关系是:在样本容量一定时,犯第一类错误概率较大时,犯第二类错误地概率较小;反之,犯第一类错误概率较小时,犯第二类错误概率较大。要想两类错误的概率都减小,只有增加样本容量。5、显著性水平显著性水平:是指人们犯第一类错误概率的最大允许值。注意:显著性水平是人们根据自己所研究的问题来确定,在经济学和其他社会科学中,常用选择的显著性水平是5%,或者10%,在卫生和医药统计中,常用选择的显著性水平是1%。在我们经济学中,除非特别声明
5、,一般都以5%作为显著性水平。6、临界值和拒绝域 拒绝域:拒绝域就是由显著性水平 所围城的区域。临界值:由给定的显著性水平确定的拒绝域的边界值,称为临界值。实际上临界值就是 分位点所对应的值。第5页/共29页 例2 某地区小麦的一般生产水平是亩产250公斤,其标准差是6公斤。现在经过品种改良试验,从25个小区抽样,结果为小麦平均亩产比原来提高20公斤。对检验假设 ,的问题,求 时,不犯第二类错误的概率。假设小麦亩产服从正态分布()。解:该地区小麦的一般生产水平是亩产250公斤,标准差是6公斤,可以认为该地区小麦产量在品种改良前是服从正态分布 。现在经过品种改良后,从25个样本数据来看,亩产比原
6、来提高了20公斤,现在的问题是这提高了的20公斤偶然的还是必然的(如果是偶然的,意味着品种改良没有提高小麦的产量,如果是必然的意味着品种改良的确提高了小麦的产量)。为此,我们用假设检方法来解决此问验题。第6页/共29页方法来解决此问验题。根据上述分析,提出原假设和备择假设是:构造检验统计量 在原假设成立时,它服从标准正态分布,其分布密度函数图形是 1.65第7页/共29页在原假设成立时,检验统计量z的值超过1.65概率小于或者等于0.05,这是一个小概率事件,在一次试验中不应该发生,如果发生,我们就有只够的理由否定原假设了。下面我们来计算一下检验统计量z 的值是多少。根据题意,z=270-25
7、0/6=3.331.65,因此我们要拒绝原假设:小麦改良后亩产仍然是250公斤。也就是说,认为小麦经过改良后亩产已经超过250公斤。0.05就称为显著性水平。Z1.65的区域称为拒绝域。Z=1.65称为临界值。下面我们来计算不犯第二类错误的概率,为此 先算出犯第二错误的概率。根据第二类错误的定义,原假设是错误的,备择假设是对的,但是我们错误地 接受了原假设(错误地没有拒绝原假设)。备择假设是 ,有无数多个,为计算犯第二类错误,必须选择其中一个,本例选择的是 ,其计算过程及有关图形如下:第8页/共29页在上图中,是在检验时,检验统计量临界值所对应的在原分布中的值,其计算过程是:第9页/共29页所
8、以有 因此犯第二类错误的概率是 所以不犯第二类错误的概率是 10.0465=0.9535 第10页/共29页7、单边检验和双边检验(1)单边检验在假设检验中,如果拒绝域在检验统计量分布密度函数一侧的检验,称为 单边检验。例如1)第11页/共29页2)第12页/共29页注意:在单边检验中,若原假设是 形式拒绝域在右侧;反之,若原假设是 形式拒绝域在左侧。(2)双边检验拒绝域在两边的假设检验,称为双边检验。例如 检验 第13页/共29页例3 在20世纪60年代,美国货币主义学派代表人物著名经济学家弗理德曼提出了一种“负收入税”,对低收入者进行补助,而不是向他们收税。这项福利计划造成受益人不工作吗?
9、在新泽西州的三个城市做了一项实验来寻求答案。总体是由这些城市一万个低收入家庭组成。从中选出225个家庭实施负收入税,400个家庭作为对照。假定这400个家庭不会因为别人获得补助而对自身产生影响。对这625个家庭跟踪3年。(1)对照家庭在3年平均受雇工作7000小时,标准差是3900小时,获益家庭平均受雇工作6200小时,标准差是3400小时。问获益家庭平均工作时间是否少于对照家庭?(2)对照家庭中,有88%的户主受雇,而实施负收入税的家庭,有82%的户主受雇。问实施负收入税的家庭户主受雇率是否低于对照组家庭的户主?第14页/共29页解:假设 分别表示获益家庭和对照家庭在3年内的平均工作时间。根
10、据题意,作如下检验:设 ,分别表示获益家庭和对照家庭样本的平均工作时间和户数,分别是两组家庭工作时间的方差。构造检验统计量第15页/共29页在原假设成立的情况下,检验统计量 服从标准正态分布。1.65第16页/共29页所以,我们不能拒绝原假设,也就是说接受原假设。即认为实施负收入税的家庭工作时间比没有实施负收入税的家庭的平均工作时间要少些。2)设 表示实施负收入税家庭和没有实施负收入税家庭的户主受雇比例,分别表示这两类样本家庭受雇的比例。检验如下:构造如下检验统计量:第17页/共29页在原假设成立时,上述检验统计量服从标准正态分布。其检验如下:1.65第18页/共29页从上式可以看出,检验统计
11、量的值小于临界值,我们不能拒绝原假设,即接受原假设,认为实施负收入税,会影响户主受雇率。综上所述,可以看出,实施负收入税确实会导致一部分家庭或个人不愿意工作。正因为如此,美国也没有实施负收入税。二、用P值进行检验P值是指在假设检验中,当原假设成立时,检验统计量取样本数据的值时的概率。例如 在下列检验中,其P值是 第19页/共29页 p值=当P值小于显著性水平时,表明检验统计量的值落在拒接域,我们拒绝原假设;反之,当P值大于显著性水平时,表明 检验统计量的值落在接受域 内,我们应该接受原假设。第20页/共29页值第21页/共29页案例分析题:新饲料养牛计划的有效性检验一家饲料开发公司研究出一种新
12、饲料,据称该饲料能有效增加牛的体重,同时还能有助于牲畜抵抗某些疾病。饲料开发公司在一家养牛厂的协作下,对新饲料的功效进行了检测。这家养牛厂的主人从2月1日到5月20日(含首尾两日)使用新饲料喂养一群牛。该群牛的有关数据如下表所示。饲料开发公司还得到了这家养牛厂去年一月15日到五月5日(含首尾两日)一群牛的喂养数据。这群牛使用的是该饲料公司生产的标准饲料。这批数据记录如下:1、初期平均体重=178公斤;标准差=25公斤(N=43)2、期末平均体重=251公斤;标准差=61公斤(N=41)3、平均每天体重增加0.91公斤;标准差=0.2公斤(N=41)4、病牛头数(含两头 已死亡的)=12头第22
13、页/共29页初始体重/公斤 期末体重/公斤是否染病 7764897168768990936285917490937280837892657476736770786211410314993101115145119153891331421241421521351511271021491271231321321221261471110111010111101100111111111第23页/共29页讨论题 1、检验食用新饲料和标准饲料的两群牛的初期体重均值没有显著差异。2、检验这两群牛的日平均增重相同。3、检验这两群牛的患病率相同。4、讨论检验中所使用的显著性水平对检验结果的影响。5、给出检验的P值
14、,并指出它的实际意义。解:1)设 分别表示食用新饲料和标准饲料的两群牛的初期体重,根据题意,检验的假设是 因此,我们构造的检验统计量是:第24页/共29页(1)计算出使用新饲料喂养的牛群的均值和方差是 所以,在原假设成立时,有第25页/共29页显然检验统计量z 的绝对值大于显著性水平为5%的临界值 1.96,故拒绝原假设,认为这两群牛的初期体重有显著差异。其检验示意图如下 0.025 0.025 2)用 分别表示食用新饲料和标准饲料的牛日平均增重量,根据题意,要检验的是如下的假设构造检验统计量是第26页/共29页(2)代入有关数据得 所以,我们拒接原假设,即认为两种饲料喂养的牛群日增加的体重量是不同的。第27页/共29页作业:P207 练习题114 (题目可以不抄,但必须复印在纸上 并贴在作业本上。)第28页/共29页感谢您的观看。第29页/共29页