《第十三讲统计学讲义.ppt》由会员分享,可在线阅读,更多相关《第十三讲统计学讲义.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十三讲统计学讲义第十三讲统计学讲义现在学习的是第1页,共30页一、假设检验问题一、假设检验问题什么是假设检验问题?我们先看几个简单的例子。什么是假设检验问题?我们先看几个简单的例子。例例 6.1.1 在超市上出售的某种品牌方便面,按规定在超市上出售的某种品牌方便面,按规定每袋净重少于每袋净重少于100克的比例不得超过克的比例不得超过 1%。技术。技术监督部门从某超市的货架上任意抽取监督部门从某超市的货架上任意抽取200袋该种品袋该种品牌的方便面,经检验发现有牌的方便面,经检验发现有3袋重量少于袋重量少于100克,克,试问:该超市出售的这种方便面是否符合质量标试问:该超市出售的这种方便面是否符
2、合质量标准。准。在本例中,在超市上出售的这种方便面的不合格率是未在本例中,在超市上出售的这种方便面的不合格率是未知的,我们关心的问题是,如何根据样本的不合格率知的,我们关心的问题是,如何根据样本的不合格率p=1.5%,来判断:在超市上出售的这种方便面的不合格率来判断:在超市上出售的这种方便面的不合格率P1%是否成立。是否成立。现在学习的是第2页,共30页例例 6.1.2 按照质量标准,某种导线的平均拉力强按照质量标准,某种导线的平均拉力强度为度为1200公斤,一批导线在出厂时抽取了公斤,一批导线在出厂时抽取了100根根进行检验,测得的平均拉力强度为进行检验,测得的平均拉力强度为1150公斤,试
3、公斤,试问:这批导线的平均拉力强度是否符合质量标准。问:这批导线的平均拉力强度是否符合质量标准。在本例中,即将出厂的这批导线的平均拉力强度是未知的,我在本例中,即将出厂的这批导线的平均拉力强度是未知的,我们关心的问题是,如何根据样本的平均拉力强度们关心的问题是,如何根据样本的平均拉力强度 公斤来判公斤来判断:断:这批导线的平均拉力强度这批导线的平均拉力强度 是否成立。是否成立。现在学习的是第3页,共30页例例 6.1.3 某大型综合商场通过随机调查某大型综合商场通过随机调查200名顾名顾客,欲研究顾客的性别与顾客的购物金额之间客,欲研究顾客的性别与顾客的购物金额之间是否存在一定的相关性。是否存
4、在一定的相关性。在本例中,假设用随机变量在本例中,假设用随机变量X表示顾客的性别,用随机变量表示顾客的性别,用随机变量Y 表示顾客的购物金额,他们之间可能有关系,也可能没有关表示顾客的购物金额,他们之间可能有关系,也可能没有关系。我们关心的问题是,如何根据系。我们关心的问题是,如何根据200名顾客的性别与购物金名顾客的性别与购物金额的样本数据来判断:随机变量额的样本数据来判断:随机变量X与与 Y是否相关。是否相关。从上面从上面3个例子可以看出,个例子可以看出,假设检验问题是假设检验问题是先要对总体的参数、总体的分布或总体的特征先要对总体的参数、总体的分布或总体的特征作出某种假设,然后利用样本数
5、据去检验这个作出某种假设,然后利用样本数据去检验这个假设是否成立。假设是否成立。现在学习的是第4页,共30页二、原假设和备择假设二、原假设和备择假设 对于假设检验问题,首先需要提出一个统计假设,对于假设检验问题,首先需要提出一个统计假设,记为记为H0,称为原假设,也称零假设或基本假设,称为原假设,也称零假设或基本假设,另一个记为另一个记为H1,称为备择假设,也称备选假设,称为备择假设,也称备选假设或对立假设。例如上面或对立假设。例如上面3个例子的统计假设分别个例子的统计假设分别为为:H0:P0.01;H1:P0.01H0:;H1:H0:随机变量随机变量X与与Y独立;独立;H1:随机变量:随机变
6、量 X与与Y不不独立。独立。现在学习的是第5页,共30页 关于总体参数的假设称为参数假设,否则,关于总体参数的假设称为参数假设,否则,称为非参数假设。例如,例称为非参数假设。例如,例 6.1.1、例、例6.2.2 是参是参数假设,例数假设,例 6.1.3 是非参数假设。是非参数假设。完全决定总体分布的假设称为简单假设,否完全决定总体分布的假设称为简单假设,否则,称为复合假设。例如则,称为复合假设。例如,“H:总体服从标准:总体服从标准正态分布正态分布”和和“H:p=0.05 ”是简单假设;是简单假设;“H:总体服从正态分布总体服从正态分布”和和“H:p0.05”是复合假设。是复合假设。现在学习
7、的是第6页,共30页三、假设检验的基本原理三、假设检验的基本原理进行假设检验的基本原理就是小概率原理。小概率原理是说概率进行假设检验的基本原理就是小概率原理。小概率原理是说概率很小的事件(称为很小的事件(称为“小概率事件小概率事件”)在一次试验中几乎是不可能)在一次试验中几乎是不可能发生的。发生的。根据小概率原理进行假设检验的方法就是概率意义下的根据小概率原理进行假设检验的方法就是概率意义下的反证法,其思想是:为了检验原假设反证法,其思想是:为了检验原假设H0是否正确,我们首是否正确,我们首先假定先假定“H0正确正确”,然后来看在,然后来看在H0是正确的假定下能导出是正确的假定下能导出什么结果
8、。如果导出一个与小概率原理相矛盾的结果,什么结果。如果导出一个与小概率原理相矛盾的结果,则说明则说明“H0正确正确”的假定是错误的,即原假设的假定是错误的,即原假设H0不正确,于不正确,于是我们应作出否定原假设是我们应作出否定原假设H0的决策;如果没有导出与小概率的决策;如果没有导出与小概率原理相矛盾的结果,则说明原理相矛盾的结果,则说明“H0正确正确”的假定没有错误,的假定没有错误,即不能认为原假设即不能认为原假设H0是不正确的,于是我们应作出不否定原是不正确的,于是我们应作出不否定原假设假设H0的决策。的决策。现在学习的是第7页,共30页 基本原理图示基本原理图示小概率原理:小概率原理:如
9、果对总体的某种假设是如果对总体的某种假设是真实真实真实真实的,那么不利于或的,那么不利于或不能支持这一假设的事件不能支持这一假设的事件A(小概率事件)在一(小概率事件)在一次试验中几乎不可能发生的;要是次试验中几乎不可能发生的;要是在一次在一次在一次在一次试验试验试验试验中中中中A A竟然发生了竟然发生了竟然发生了竟然发生了,就有理由怀疑该假设的真实性,就有理由怀疑该假设的真实性,拒拒拒拒绝绝绝绝这一假设。这一假设。总总 体体(某种假设)(某种假设)抽样抽样样样 本本(观察结果)(观察结果)检验检验(接受)(接受)(拒绝)(拒绝)小概率事件小概率事件未未 发发 生生小概率事件小概率事件发发 生
10、生现在学习的是第8页,共30页例如,有一个厂商声称其产品的合格率高达例如,有一个厂商声称其产品的合格率高达99%,那么从,那么从100件产品中随机抽取件产品中随机抽取1件,经检件,经检验它恰好是次品的可能性就很小,因为抽中次验它恰好是次品的可能性就很小,因为抽中次品的概率仅为品的概率仅为1%,是一个小概率事件。但如,是一个小概率事件。但如果在一次抽取中抽到了次品,那么我们就有理果在一次抽取中抽到了次品,那么我们就有理由怀疑该厂商的声称,认为合格率高达由怀疑该厂商的声称,认为合格率高达99%是是不真实的,就可以作出厂商的声称是假的推断。不真实的,就可以作出厂商的声称是假的推断。当然,我们也可能推
11、断错了,即产品的合格率当然,我们也可能推断错了,即产品的合格率确实是确实是99%,100件产品中确实仅有件产品中确实仅有1件次品,件次品,而在这次抽取中恰好被抽到了。而在这次抽取中恰好被抽到了。现在学习的是第9页,共30页事件的概率小到什么程度才算小概率事件,没事件的概率小到什么程度才算小概率事件,没有一个绝对的标准,要根据具体问题而定,一有一个绝对的标准,要根据具体问题而定,一般概率为般概率为0.10、0.05 或或0.01的事件,就可以认的事件,就可以认为是小概率事件。为是小概率事件。现在学习的是第10页,共30页四、否定域和接受域四、否定域和接受域现在学习的是第11页,共30页图图6.1
12、.1现在学习的是第12页,共30页五、假设检验的两类错误五、假设检验的两类错误 在进行假设检验时,可能出现在进行假设检验时,可能出现4种情况:种情况:1.当当H0为真时,检验统计量的值落在接受域里,这时应为真时,检验统计量的值落在接受域里,这时应作出接受作出接受H0的决策;的决策;2.当当H0为真时,检验统计量的值没有落在接受域而落在为真时,检验统计量的值没有落在接受域而落在否定域里,这时应作出否定否定域里,这时应作出否定H0的决策;的决策;3.当当 H0为非真时,检验统计量的值落在接受域里,这时为非真时,检验统计量的值落在接受域里,这时应作出接受应作出接受H0的决策;的决策;4.当当H0为非
13、真时,检验统计量的值没有落在接受域而落在否为非真时,检验统计量的值没有落在接受域而落在否定域里,这时应作出否定定域里,这时应作出否定 H0的决策。的决策。显然,在第显然,在第1、4两种情况下,作出的决策是正确的,在第两种情况下,作出的决策是正确的,在第2、3两种情况下,作出的决策是错误的。两种情况下,作出的决策是错误的。现在学习的是第13页,共30页现在学习的是第14页,共30页现在学习的是第15页,共30页现在学习的是第16页,共30页现在学习的是第17页,共30页六、假设检验一般步骤六、假设检验一般步骤根据具体问题的要求,根据具体问题的要求,建立总体假设建立总体假设H0,H112选择统计量
14、选择统计量确定确定H0为真时的抽样分布为真时的抽样分布3给定显著性水平给定显著性水平,当原假设,当原假设H0为真时,求出临界值。为真时,求出临界值。计算检验统计量的数值计算检验统计量的数值与临界值比较与临界值比较4现在学习的是第18页,共30页假设检验的一般步骤:假设检验的一般步骤:(一)根据所研究问题的要求,提出原假设(一)根据所研究问题的要求,提出原假设 H0和备择假设和备择假设H1。现在学习的是第19页,共30页原假设和备择假设的选取说明原假设和备择假设的选取说明假设检验是控制犯第一类错误的概率,所以检验本身对原假设起保护的假设检验是控制犯第一类错误的概率,所以检验本身对原假设起保护的作
15、用,决不轻易拒绝原假设,因此原假设与备择假设的地位是不相等的,作用,决不轻易拒绝原假设,因此原假设与备择假设的地位是不相等的,正因为如此,正因为如此,常常把那些保守的、历史的、经验的取为原假设,而把那常常把那些保守的、历史的、经验的取为原假设,而把那些猜测的、可能的、预期的取为备择假设。些猜测的、可能的、预期的取为备择假设。比如:对于双侧检验,这选择问题应该比较简单,一般都是比如:对于双侧检验,这选择问题应该比较简单,一般都是“是不是是不是”、“等不等不等于等于”和和“变没变变没变”这一类的问题,一般我们期待的结果多为这一类的问题,一般我们期待的结果多为“不是不是”、“不等不等于于”和和“变了
16、变了”这样的结果,所以把不等号的设为备择假设的。这样的结果,所以把不等号的设为备择假设的。对于单侧检验,一般都是对于单侧检验,一般都是“增加了增加了”、“提高了提高了”或或“减少了减少了”、“降低了降低了”这一类问题,比如某产品的在使用了新技术生产后,问产品这一类问题,比如某产品的在使用了新技术生产后,问产品质量是否提高了,我们期待的结果是提高了,这样就把大于号定为备质量是否提高了,我们期待的结果是提高了,这样就把大于号定为备择假设,相反的小于等于号定为原假设。择假设,相反的小于等于号定为原假设。现在学习的是第20页,共30页(二)选择统计量确定(二)选择统计量确定(二)选择统计量确定(二)选
17、择统计量确定H0为真时的抽样分布为真时的抽样分布现在学习的是第21页,共30页(三三三三)给定显著性水平给定显著性水平,当原假设,当原假设H0为真时,求出临为真时,求出临界值。界值。现在学习的是第22页,共30页现在学习的是第23页,共30页(四)计算检验统计量的数值与临界值比较(四)计算检验统计量的数值与临界值比较(四)计算检验统计量的数值与临界值比较(四)计算检验统计量的数值与临界值比较现在学习的是第24页,共30页 几种常见的假设检验几种常见的假设检验条件条件检验统计量检验统计量Z拒绝域拒绝域H0、H1(1)H0:=0 H1:0z(2)H0:=0 H1:0(3)H0:=0 H1:z0z0
18、1.1.大样大样本本2 2已已知或未知或未知;知;2.小样小样本本正态正态总体总体2 2已知已知或或现在学习的是第25页,共30页条件条件检验统计量检验统计量t拒绝域拒绝域H0、H1(1)H0:=0 H1:0t(2)H0:=0 H1:0(3)H0:=0 H1:t0t00正态总正态总体体2未未知知(n30)现在学习的是第26页,共30页【例例61】上次普查资料显示某市人均居住面积为上次普查资料显示某市人均居住面积为7.6平方平方米米,现从该市中随机抽取现从该市中随机抽取500人人,调查并计算得平调查并计算得平均居住面积为均居住面积为7.8平方米平方米,标准差为标准差为1.5平方米平方米,问问在在
19、0.01的显著性水平下的显著性水平下,能否认为该市人均居住能否认为该市人均居住面积有所增大面积有所增大?现在学习的是第27页,共30页解:解:现在学习的是第28页,共30页【例例62】某贸易公司用自动装袋机将一批名茶装袋,在某贸易公司用自动装袋机将一批名茶装袋,在正常情况下,平均每袋的重量为正常情况下,平均每袋的重量为500克,从某克,从某天所包装的茶叶中随机抽取了天所包装的茶叶中随机抽取了8袋,测得每袋袋,测得每袋的重量(克)为:的重量(克)为:495,501,502,495,500,497,502,499,假定茶叶重量服从正态分,假定茶叶重量服从正态分布,问在布,问在0.05的显著性水平下,从所装茶叶的的显著性水平下,从所装茶叶的平均重量来看装袋机运行是否正常?平均重量来看装袋机运行是否正常?现在学习的是第29页,共30页解:解:现在学习的是第30页,共30页