《假设检验5学习.pptx》由会员分享,可在线阅读,更多相关《假设检验5学习.pptx(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【实例描述】随便掷一枚一元的硬币,假设硬币是均匀的,你觉得正面朝上的概率是多大?然后自己动手做做实验看看,实践和理论是否总是一致的?法国自然主义者布方伯爵做过类似的实验:他共掷了4040次铜板,得到了2048次正面,可以算出正面朝上样本的比例是:。结果比我们通常所认为的“一半”稍多了点。难道铜板正反面出现的概率不是 的吗?问题出现在哪?第1页/共54页6.1 假设检验的基本概念假设假设检验第2页/共54页假设1什么是假设假设是对总体参数的具体数值所作的陈述,如:“我认为这种新药的疗效比原有的药物更有效”。总体参数可以是总体均值、比例、方差等,在对总体参数分析之前必需先陈述。第3页/共54页假设
2、2提出假设研究者想收集证据予以反对的假设称为原假设(或0假设),一般有符号 ,或,用H0表示,如原假设H0:=50。研究者想收集证据予以支持的假设称为备择假设,总有符号 ,或 ,用H1表示,如备择假设H1:50。又如引例中,研究者想收集证据以证明“投掷硬币正面朝上的概率不是“”,建立的原假设和备择假设为H0:,H1:。第4页/共54页假设例6-1:一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假
3、设为:H0:30%,H1:30%第5页/共54页假设注意:(1)原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立。(2)先确定备择假设,再确定原假设。(3)等号“=”总是放在原假设上。(4)因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)。第6页/共54页假设检验假设检验又叫显著性检验,是统计推断的另一个重要内容。假设检验是先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的一种统计方法。它是在对总体的数量特征和变动规律做出一定假设的基础上,运用观察到的样本实际资料和一定的数理程序,对事
4、先所作的假设给出是否合理可信的判断,从而决定接受或拒绝这个假设。如:对某地人口的平均年龄作调查,提出假设:“我认为人口的平均年龄是50岁”,经过随机抽样调查得样本的平均年龄是20岁,然后作出判断:“人口平均年龄不是50岁”。第7页/共54页假设检验1.假设检验的基本思想小概率原理:小概率事件在一次试验中是几乎不可能发生的,假若在一次试验中小概率事件事实上发生了,那只能认为事件不是来自我们假设的总体,也就是认为我们对总体所做的假设不正确。在许多实际问题中,总体分布的类型已知,仅其中一个或几个参数未知,只要对一个或几个未知参数做出假设,就可以确定总体的分布,这种只涉及总体分布的未知参数的假设检验称
5、为参数检验。第8页/共54页假设检验例:对某地人口的平均年龄作调查,根据上一次调查的数据显示,该地区人口的平均年龄是50岁,并服从正态分布(50,52)。经过随机抽样调查100个对象得样本的平均年龄是20岁,判断该地区平均年龄是否还是50岁?第9页/共54页假设检验首先,根据上一次调查的数据该地区人口平均年龄是50岁,于是假设:该地区平均年龄还是50岁,即H0:=50。如果原假设成立,则x N(50,52),从而由单个总体的抽样分布的结论可知:,统计量 。第10页/共54页假设检验对于给定的置信水平1-,服从标准正态分布的统计量z落在区域 外的概率是,这是一个小概率。这也就是说,如果原假设H0
6、:=50成立,那么由抽出的样本观测值计算出的统计量z的观测值|z0|大于|z/2|的可能性非常小,而它又在一次抽样中发生了,这是不合理的。产生这种不合理的根源在于假设的H0:u=50不合理,因此只有拒绝原假设,别无他法。第11页/共54页假设检验假设检验的基本原理:首先对所研究的命题提出一种假设无显著性的假设,并假定这一假设成立,然后由此导出其必然的结果。如果能证明这种结果出现的可能性很小,那么我们就有理由认为原假设是错误的,从而拒绝接受这个假设。否则,我们就认为原假设是可能的,从而予以接受。假设检验的原理实质上是考察事件发生的可能性问题,其理论依据是“小概率原理”,即小概率事件在一次试验中几
7、乎是不可能发生的判断原理。第12页/共54页假设检验2假设检验中的两类错误假设检验就好像一场审判过程。在作出拒绝或不能拒绝原假设的决策时,我们是基于样本信息来判断的,而由于样本的随机性,就使我们有可能会犯错误。原假设嫌疑人是无罪的,在陪审团审判后可能有两种结果:有罪或无罪。审判结果与实际情况的可能结果如下两张表中所示。H0:无罪陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0 检验决策实际情况H0为真H0为假未拒绝H0正确决策(1 a)第类错误()拒绝H0第类错误(a)正确决策(1-)第13页/共54页假设检验陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0 检验决策实际情
8、况H0为真H0为假未拒绝H0正确决策(1 a)第类错误()拒绝H0第类错误(a)正确决策(1-)陪审团的裁决有可能是错误的,一类错误是嫌疑人确实无罪,但审判结果却是有罪;还有一类错误是嫌疑人有罪,但审判结果是他无罪。同陪审团审判一样,假设检验也存在这两类错误。第类错误是原假设为真时拒绝原假设,叫做弃真错误,第类错误发生的概率记为;第类错误是原假设为假时未拒绝原假设,也叫取伪错误,第类错误发生的概率记为。见表5-1。第14页/共54页假设检验和 的关系就像翘翘板,小 就大,大 就小,但是在假设检验的过程中不能同时减少两类错误。如果要避免其中的任何种错误,都会使犯另一类错误的机会增加。表5-1 假
9、设检验的两种错误类型第15页/共54页假设检验3假设检验的基本步骤(1)构造假设(原假设、备择假设)。(2)确定检验的统计量及其分布(正态分布、t分布)。(3)确定显著性水平()。(4)确定决策规则(找出接受域、拒绝域;有临界值法和P值法)。(5)判断决策(接受或不接受)。如果检验统计量的值落于拒绝域,则我们有理由不接受原假设,反之,则不拒绝接受原假设。第16页/共54页6.2 一个正态总体的统计假设检验构造检验统计量总体标准差已知条件下的均值检验总体标准差未知条件下大样本的均值检验总体标准差未知条件下小样本的均值检验第17页/共54页构造检验统计量设总体X服从正态分布 ,方差 已知,可以通过
10、构造一个服从正态分布的统计量z来进行关于均值的假设检验。设 是来自正态总体X的一个简单随机样本,样本均值为 ,根据单个总体的抽样分布结论,选用统计量 。第18页/共54页构造检验统计量如果给定一个常数0,根据不同的问题可以做出不同的假设。(1)是否等于0,假设:(双侧检验)。(2)是否不大于0,假设:(右侧检验),它与模型 有相同的拒绝域。(3)是否不小于0,假设:(左侧检验),它与模型 有相同的拒绝域。第19页/共54页构造检验统计量当H0成立时,N(0,1)。对于假设(1),当 时,拒绝H0,否则不拒绝H0;其拒绝域是 ,如图5-1所示阴影部分。图5-1 双侧检验的拒绝域与接受域第20页/
11、共54页构造检验统计量对于假设(2),当 时,拒绝H0,否则不拒绝H0;其拒绝域是 ,如图5-2所示阴影部分。图5-2 右侧检验的拒绝域与接受域第21页/共54页构造检验统计量对于假设(3),当 时,拒绝H0,否则不拒绝H0;其拒绝域是 ,如图5-3所示阴影部分。图5-3 左侧检验的拒绝域与接受域第22页/共54页构造检验统计量在一个正态总体均值的检验中,用到的统计量有z统计量,t统计量。但在假设检验时选用什么统计量进行检验,需要考虑样本量的大小,总体的标准差是否已知。采用双侧检验还是采用单侧检验(以及左侧还是右单尾),取决于备择假设的形式。见表5-2.表5-2 拒绝域的单、双侧与备择假设之间
12、的对应关系第23页/共54页总体标准差已知条件下的均值检验 例6-2:某电子元器件生产厂对一批产品进行检测,根据该产品生产质量标准,其使用寿命不低于2000小时。根据以往经验,该电子元器件的使用寿命服从正态分别,标准差为100小时。质量部从该批产品中随机抽取了120个产品进行检测,测得样本均值为1960小时,在=0.01的显著性水平下检验该批电子元器件的质量是否符合要求。第24页/共54页总体标准差已知条件下的均值检验解:由题可知总体服从正态分布 ,样本均值 ,样本容量 。这是一个单侧检验的问题。(1)建立原假设 ,备择假设 ,(2)构造统计量 ,(3)查表得 ,因为 ,统计量Z值落在拒绝域内
13、,不能接受原假设。所以,我们有理由认为该批电子元器件的质量不符合质量标准。第25页/共54页总体标准差未知条件下大样本的均值检验在大样本条件下,如果总体为正态分布,样本统计量服从正态分布;如果总体为非正态分布,样本统计量近似服从正态分布。所以,在正态总体的标准差未知,大样本条件下,我们可以用样本标准差代替标准差。构造统计量 ,原假设 ,备选假设(1)(检验总体均值与0是否有显著差异),(2)(若已知不可能小于0,检验总体均值是否显著变大),(3)(若已知不可能大于0,检验总体均值是否显著变小),第26页/共54页总体标准差未知条件下大样本的均值检验对于给定的显著性水平,其拒绝域:第27页/共5
14、4页总体标准差未知条件下大样本的均值检验 例6-3:某医学科研机构对从事某作业男性工人进行了研究,测量了80名从事该作业男性工人的血红蛋白含量,算得其均数为13083g/L,标准差为2574g/L。已知成年男性血红蛋白含量服从正态分布,问:在=0.05的显著性水平下检验从事该作业男性工人血红蛋白含量是否不同于正常成年男性平均值140g/L。第28页/共54页解:解:由题可知总体服从正态分布,未知,大样本,0=140g/L,样本均值x=13083g/L,样本标准差s=2574g/L,样本容量n=80。这是一个双侧检验的问题。(1)建立原假设H0:=140g/L,备择假设H1:140g/L,(2)
15、构造统计量 =,(3)查表得Z0.05/2=1.96,因为 Z0.05/2=1.96,统计量Z值落在拒绝域内,不能接受原假设。所以,我们有理由认为该作业的男性工人的血红蛋白含量与正常成年男性的血红蛋白含量有显著差异。总体标准差未知条件下大样本的均值检验第29页/共54页总体标准差未知条件下小样本的均值检验 当总体服从正态分布且2 未知,且在小样本的条件下,则需用样本方差 代替2,样本统计量服从t分布,原假设 备选假设(1)(检验总体均值与0是否有显著差异)(2)(若已知不可能小于0,检验总体均值是否显著变大)(3)(若已知不可能大于0,检验总体均值是否显著变小)对于给定的显著性水平,其拒绝域:
16、(1),:;(2),:;(3),:;第30页/共54页总体标准差未知条件下小样本的均值检验第31页/共54页总体方差的假设检验检验方差的基本思想是:利用样本方差建立一个 统计量,并为这个总体方差的统计量构造一个置信区间。这个置信区间包括总体方差的概率是1-,显著性水平是。在确定的水平下,统计量 有固定的拒绝区域,在单侧检验中,拒绝域分布在统计量 的分布曲线的一边;在双侧检验中,拒绝域分布在统计量 的分布曲线的两边。如果检验统计量大于或等于临界值而落入拒绝域,或P值小于显著性水平而落入拒绝域,便拒绝原假设;反之,则接受原假设。第32页/共54页总体方差的假设检验方差检验的基本步骤如下:(1)提出
17、原假设H0和备择假设H1,H0:;H1:。(2)构造检验统计量 ,在H0成立的条件下,统计量 服从自由度为n-1的 分布。第33页/共54页总体方差的假设检验(3)确定显著性水平。(4)规定决策规则。在双侧检验的情况下,拒绝域在两侧,如果检验统计量大于右侧 临界值,或小于左侧 临界值,则拒绝原假设。若是单侧检验,拒绝区域分布在一侧,具体左侧还是右侧根据备择假设H1的情况而定。(5)进行判断决策。第34页/共54页总体方差的假设检验例6-5:灌装机是用来包装如牛奶、软饮料、油漆等各种液体的机器。一家公司新开发的一种灌装机,号称能连续稳定地灌装1000毫升的容器,灌装量的方差低于1。为了检验该说法
18、的准确性,随机抽取了25灌1000毫升灌装作为一个样本(如下),通过这些数据能否在5%的显著性水平下证明该说法是正确的?第35页/共54页6.3 用Excel作假设检验用Excel进行一个正态总体的均值检验用Excel进行方差检验第36页/共54页用Excel进行一个正态总体的均值检验例6-9:根据例6-2中的资料,利用Excel检验在显著性水平的条件下该批电子元器件的质量是否符合要求。已知总体服从正态分布,样本均值 ,样本容量 。(1)建立“产品质量均值检验”工作表,如图5-4所示。图5-4“产品质量均值检验”工作表第37页/共54页用Excel进行一个正态总体的均值检验(2)在单元格B6中
19、输入公式“=ABS(NORMSINV(B5)”,回车后显示2.326348,为临界值z。(3)在单元格B7中输入公式“=(B4-B1)/(B2/SQRT(B3)”,回车后显示-4.38178,为检验统计量。(4)在单元格B8中输入公式“=IF(B7B6,拒绝,接受)”,回车后显示“拒绝”,如图5-7所示。图5-7 总体均值双侧检验结果(2)在单元格B6中输入公式“=ABS(NORMSINV(B5/2)”,回车后显示1.959964,为临界值z。第41页/共54页用Excel进行一个正态总体的均值检验例6-11:根据例6-4中资料,利用Excel检验在显著性水平的条件下新技术采用前与采用后生产的
20、显像管的平均寿命是否有显著差异。解:已知总体服从正态分布,未知,小样本,样本均值 ,样本标准差s=1300,样本容量n=20。第42页/共54页用Excel进行一个正态总体的均值检验(1)建立“t检验”工作表,如图5-8所示。(2)在单元格B6中输入公式“=ABS(TINV(B5/2,19)”,回车后显示2.43344,为t临界值。(3)在单元格B7中输入公式“=(B4-B1)/(B2/SQRT(B3)”,回车后显示6.364193,为检验统计量。(4)在单元格B8中输入公式“=IF(ABS(B7)B6,拒绝,接受)”,回车后显示“拒绝”,如图5-9所示。图5-8“t检验”工作表图5-9 t检
21、验结果第43页/共54页用Excel进行方差检验例6-12:某厂生产的某种电池,其寿命长期以来服从方差 =5000(小时)的正态分布。今有一批这种电池,随即抽取26个进行测试,测得其寿命的样本方差为 =6500(小时)。试问,在检验水平 下这批电池寿命的波动性较以往是否有显著变化?第44页/共54页用Excel进行方差检验根据题意,已知总体方差 =5000,样本方差 S2=6500,样本容量n=26,为小样本。构造原假设H0:2=5000,备择假设H1:25000,这是一个双侧检验问题,选择 作为检验统计量。第45页/共54页用Excel进行方差检验(1)建立“总体方差检验”工作表,如图5-1
22、0所示。图5-10“总体方差检验”工作表(2)在单元格B5中输入公式“=CHIINV(B4/2,B3-1)”,回车后显示40.64647,为 临界值。图5-10“总体方差检验”工作表第46页/共54页用Excel进行方差检验(3)在单元格B6中输入公式“=(B3-1)*B2/B1”,回车后显示32.5,为检验统计量。(4)在单元格B7中输入公式“=IF(B6ABS(B5),不拒绝,拒绝)”,回车后显示“不拒绝”。表明在显著性水平0.05的条件下,不能证明这种电池寿命的方差不是5000小时。计算结果如图5-11所示。图5-11 总体方差检验结果第47页/共54页6.4 上机实验五 用Excel进
23、行假设检验一、实验目的及要求1理解假设检验的基本思想,掌握假设检验的基本步骤,会根据需要正确建立原假设与备择假设。2掌握用Excel函数进行假设检验的基本方法,会用Excel正确进行假设检验,并做出判断。3会利用Excel数据分析工具进行假设检验,并能做出正确的判断。第48页/共54页6.4 上机实验五 用Excel进行假设检验二、实验内容(一)某高中校在今年高三学生参加高考之前,对学生进行了2次模拟考试。根据模拟考试成绩显示,该校10个高三班的平均成绩如下:班级班级模拟模拟1模拟模拟2145846224694713472475446145154854756502498748249284734
24、67946347210471468(1)试分析两次模拟考试成绩有无显著性差异?显著性水平0.05。(2)若已知上一年高考的平均成绩为475分,标准差为20分,这两次模拟考试成绩是否与上年的高考成绩有显著性差异?=0.05。(3)假设方差不变,今年学生成绩是否比上一年提高?第49页/共54页6.4 上机实验五 用Excel进行假设检验(二)某车间生产钢丝,用表示钢丝的折断力,由经验判断 ,其中 ,今换了一批材料,从性能上看,估计折断力的方差 不会有什么变化(即仍有 ),但不知折断力的均值和原先有无差别.现抽得样本,测得其折断力为:578 572 570 568 572 570 570 572 5
25、96 584 取 试检验折断力均值有无变化?第50页/共54页6.4 上机实验五 用Excel进行假设检验(三)从一批零件中任取100件,测其直径,得平均直径为5.2,标准差为1.6.在显著性水平下,判定这批零件的直径是否符合5的标准。(四)某地某年高考后随机抽得15名男生、12名女生的物理考试成绩如下:男生:49 48 47 53 51 43 39 57 56 46 42 44 55 44 40女生:46 40 47 51 43 36 43 38 48 54 48 34从这27名学生的成绩能说明这个地区男女生的物理考试成绩不相上下吗?(显著性水平)第51页/共54页【小 结】本章介绍了假设检
26、验的基本思想和基本步骤;总体标准差已知条件下的均值检验;总体标准差未知条件下大样本的均值检验;总体标准差未知条件下小样本的均值检验;总体方差的假设检验;两个独立总体方差已知,两个独立总体均值之差的检验;两个独立总体方差未知,两个独立总体均值之差的检验;两个独立总体方差未知且不相等,两个独立总体均值之差的检验;两个独立总体直接的方差检验。第52页/共54页【思考与练习题】1.设某厂生产一种灯管,其寿命服从正态分布.N(;40000),从过去较长一段时间的生产情况来看,灯管的平均寿命为=1500小时.现在采用新工艺后,在所生产的灯管中抽取25只,测得平均寿命为1675小时.问采用新工艺后,灯管寿命是否是显著提高?2.每盒所装的麦片平均数是否超过368克?随机抽取25盒为样本,均值为X=372.5。公司确定在=0.05,标准差为=15克的条件下进行检验。第53页/共54页感谢您的观看。第54页/共54页