《[精选]数理统计之假设检验.pptx》由会员分享,可在线阅读,更多相关《[精选]数理统计之假设检验.pptx(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、假设检验假设检验参数假设检验参数假设检验非参数假设检验非参数假设检验这类问题称作假设检验问题这类问题称作假设检验问题.总体分布,总体分布,检验关于未知参数检验关于未知参数的某个假设的某个假设总体分布未知时的总体分布未知时的假设检验问题假设检验问题 在在本本讲讲中中,我我们们将将讨讨论论不不同同于于参参数数估估计计的的另另一一类类重重要要的的统统计计推推断断问问题题.这这就就是是根根据据样样本本的的信信息息检检验验关关于于总总体体的的某某个个假假设设是是否否正确正确.让我们先看一个例子让我们先看一个例子.这一讲我们讨论对参数的假设检验这一讲我们讨论对参数的假设检验.生产流水线上罐装可生产流水线上
2、罐装可乐不断地封装,然后装箱乐不断地封装,然后装箱外运外运.怎么知道这批罐装怎么知道这批罐装可乐的容量是否合格呢?可乐的容量是否合格呢?把每一罐都翻开倒入量杯把每一罐都翻开倒入量杯,看看容量是否合于标准看看容量是否合于标准.这样做显然这样做显然不行!不行!罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫升之间毫升之间.每隔一定时间,抽查假设干罐每隔一定时间,抽查假设干罐.如每隔如每隔1小时,小时,抽查抽查5罐,得罐,得5个容量的值个容量的值X1,X5,根,根据这些值来判断生产是否正常据这些值来判断生产是否正常.如发现不正常,就应停产,找出原因,如发现不正常,就应停产,
3、找出原因,排除故障,然后再生产;如没有问题,就排除故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,继续按规定时间再抽样,以此监督生产,保证质量保证质量.通常的方法是进行抽样检查通常的方法是进行抽样检查.很明显,不能由很明显,不能由5罐容量的数据,在把罐容量的数据,在把握不大的情况下就判断生产握不大的情况下就判断生产 不正常,因为不正常,因为停产的损失是很大的停产的损失是很大的.当然也不能总认为正常,有了问题不能当然也不能总认为正常,有了问题不能及时发现,这也要造成损失及时发现,这也要造成损失.如何处理这两者的关系,假设检验面如何处理这两者的关系,假设检验面对的就是这种矛盾对
4、的就是这种矛盾.在正常生产条件下,由于种种随机因素在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在的影响,每罐可乐的容量应在355毫升上下毫升上下波动波动.这些因素中没有哪一个占有特殊重要这些因素中没有哪一个占有特殊重要的地位的地位.因此,根据中心极限定理,假定每因此,根据中心极限定理,假定每罐容量服从正态分布是合理的罐容量服从正态分布是合理的.现在我们就来讨论这个问题现在我们就来讨论这个问题.罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫升之间毫升之间.它的对立假设是:它的对立假设是:称称H0为原假设或零假设,解消假设;为原假设或零假设,解消假设;称称
5、H1为备选假设或对立假设为备选假设或对立假设.在实际工作中,在实际工作中,往往把不轻易往往把不轻易否定的命题作否定的命题作为原假设为原假设.H0:(=355)H1:这样,我们可以认为这样,我们可以认为X1,X5是取自正态是取自正态总体总体 的样本,的样本,是一个常数是一个常数.当生产比较稳定时,当生产比较稳定时,现在要检验的假设是:现在要检验的假设是:那么,如何判断原假设那么,如何判断原假设H0 是否成立呢?是否成立呢?较大、较小是一个相对的概念,合理的界较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?限在何处?应由什么原则来确定?由于由于 是正态分布的期望值,它的估计量是是
6、正态分布的期望值,它的估计量是样本均值样本均值 ,因此可以根据,因此可以根据 与与 的差距的差距来判断来判断H0 是否成立是否成立.-|较小时,可以认为较小时,可以认为H0是成立的;是成立的;当当-|生产已不正常生产已不正常.当当较大时,应认为较大时,应认为H0不成立,即不成立,即-|问题归结为对差异作定量的分析,以确定问题归结为对差异作定量的分析,以确定其性质其性质.差异可能是由抽样的随机性引起的,称为差异可能是由抽样的随机性引起的,称为“抽样误差或抽样误差或 随机误差随机误差这种误差反映偶然、非本质的因素所引起这种误差反映偶然、非本质的因素所引起的随机波动的随机波动.然而,这种随机性的波动
7、是有一定限然而,这种随机性的波动是有一定限度的,如果差异超过了这个限度,则我们度的,如果差异超过了这个限度,则我们就不能用抽样的随机性来解释了就不能用抽样的随机性来解释了.必须认为这个差异反映了事物的本质差异,必须认为这个差异反映了事物的本质差异,即反映了生产已不正常即反映了生产已不正常.这种差异称作这种差异称作“系统误差系统误差”问题是,根据所观察到的差异,如何问题是,根据所观察到的差异,如何判断它究竟是由于偶然性在起作用,还是判断它究竟是由于偶然性在起作用,还是生产确实不正常?生产确实不正常?即差异是即差异是“抽样误差还是抽样误差还是“系统误差系统误差所引起的?所引起的?这里需要给出一个量
8、的界限这里需要给出一个量的界限.问题是:如何给出这个量的界限?问题是:如何给出这个量的界限?这里用到人们在实践中普遍采用的一个原则:这里用到人们在实践中普遍采用的一个原则:小概率事件在一次试验小概率事件在一次试验中基本上不会发生中基本上不会发生.下面我们用一例说明这个原则下面我们用一例说明这个原则.小概率事件在一次试验小概率事件在一次试验中基本上不会发生中基本上不会发生.这里有两个盒子,各装有这里有两个盒子,各装有100个球个球.一盒中的白球和红球数一盒中的白球和红球数99个红球个红球一个白球一个白球99个个另一盒中的白球和红球数另一盒中的白球和红球数99个白球个白球一个红球一个红球99个个小
9、概率事件在一次试验小概率事件在一次试验中基本上不会发生中基本上不会发生.现从两盒中随机取出一个盒子,问这个盒子现从两盒中随机取出一个盒子,问这个盒子里是白球里是白球99个还是红球个还是红球99个?个?小概率事件在一次试验小概率事件在一次试验中基本上不会发生中基本上不会发生.我们不妨先假设:这个盒子里有我们不妨先假设:这个盒子里有99个白球个白球.现在我们从中随机摸出一个球,发现是现在我们从中随机摸出一个球,发现是此时你如何判断这个假设是否成立呢?此时你如何判断这个假设是否成立呢?假设其中真有假设其中真有99个白球,个白球,摸出红球的概率只有摸出红球的概率只有1/100,这是小概率事件,这是小概
10、率事件.这个例子中所使用的推理方法,可以称为这个例子中所使用的推理方法,可以称为小概率事件在一次试验中竟然发生了,不能不小概率事件在一次试验中竟然发生了,不能不使人疑心所作的假设使人疑心所作的假设.带概率性质的反证法带概率性质的反证法不妨称为概率反证法不妨称为概率反证法.小概率事件在一次试验小概率事件在一次试验中基本上不会发生中基本上不会发生.它不同于一般的反证法它不同于一般的反证法 概率反证法的逻辑是:如果小概率事件在概率反证法的逻辑是:如果小概率事件在一次试验中居然发生,我们就以很大的把握否一次试验中居然发生,我们就以很大的把握否认原假设认原假设.一般的反证法要求在原假设成立的条件下一般的
11、反证法要求在原假设成立的条件下导出的结论是绝对成立的,如果事实与之矛盾,导出的结论是绝对成立的,如果事实与之矛盾,则完全绝对地否认原假设则完全绝对地否认原假设.请看请看红楼梦中的掷骰子红楼梦中的掷骰子 现在回到我们前面罐装可乐的例中:现在回到我们前面罐装可乐的例中:在提出原假设在提出原假设H0后,如何作出接受和拒绝后,如何作出接受和拒绝H0的结论呢?的结论呢?在假设检验中,我们称这个小概率为显在假设检验中,我们称这个小概率为显著性水平,用著性水平,用 表示表示.常取常取 的选择要根据实际情况而定。的选择要根据实际情况而定。罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫毫升和升和360
12、毫升之间毫升之间.一批可乐出厂前应一批可乐出厂前应进行抽样检查,现抽查了进行抽样检查,现抽查了n罐,测得容罐,测得容量为量为X1,X2,Xn,问这一批可乐的容问这一批可乐的容量是否合格?量是否合格?提出假设提出假设选检验统计量选检验统计量 N(0,1)H0:=355 H1:355由于由于 已知,已知,它能衡量差异它能衡量差异大小且分布已知大小且分布已知.对给定的显著性水平对给定的显著性水平 ,可以在,可以在N(0,1)表表中查到分位点的值中查到分位点的值 ,使,使故我们可以取拒绝域为:故我们可以取拒绝域为:也就是说也就是说,“”是一个小概率事件是一个小概率事件.W:如果由样本值算得该统计量的实
13、测值落入如果由样本值算得该统计量的实测值落入区域区域W,则拒绝,则拒绝H0;否则,不能拒绝;否则,不能拒绝H0.如果如果H0 是对的,那么衡量差异大小的是对的,那么衡量差异大小的某个统计量落入区域某个统计量落入区域 W拒绝域拒绝域 是个小是个小概率事件概率事件.如果该统计量的实测值落入如果该统计量的实测值落入W,也就是说,也就是说,H0 成立下的小概率事件发成立下的小概率事件发生了,那么就认为生了,那么就认为H0不可信而否认它不可信而否认它.否否则我们就不能否认则我们就不能否认H0 只好接受它只好接受它.这里所依据的逻辑是:这里所依据的逻辑是:不否认不否认H0并不是肯定并不是肯定H0一定对,而
14、一定对,而只是说差异还不够显著,还没有到达足只是说差异还不够显著,还没有到达足以否认以否认H0的程度的程度.所以假设检验又叫所以假设检验又叫“显著性检验显著性检验 如果显著性水平如果显著性水平 取得很小,则拒绝取得很小,则拒绝域也会比较小域也会比较小.其产生的后果是:其产生的后果是:H0难于被拒绝难于被拒绝.如果在如果在 很小的情况很小的情况下下H0仍被拒绝了,则说仍被拒绝了,则说明实际情况很可能与之明实际情况很可能与之有显著差异有显著差异.基于这个理由,人们常把基于这个理由,人们常把 时拒绝时拒绝H0称为是显著的,而把在称为是显著的,而把在 时拒绝时拒绝H0称为是高度显著的称为是高度显著的.
15、在上面的例子的表达中,我们已经初步在上面的例子的表达中,我们已经初步介绍了假设检验的基本思想和方法介绍了假设检验的基本思想和方法.下面,我们再结合另一个例子,进一步下面,我们再结合另一个例子,进一步说明假设检验的一般步骤说明假设检验的一般步骤.例例2 某工厂生产的一种螺钉,标准要求长度是某工厂生产的一种螺钉,标准要求长度是32.5毫米毫米.实际生产的产品,其长度实际生产的产品,其长度X假定服从假定服从正态分布正态分布 未知,现从该厂生产的未知,现从该厂生产的一批产品中抽取一批产品中抽取6件件,得尺寸数据如下得尺寸数据如下:32.56,29.66,31.64,30.00,31.87,31.03问
16、这批产品是否合格问这批产品是否合格?分析:这批产品螺钉长度分析:这批产品螺钉长度的全体组成问题的总体的全体组成问题的总体X.现在要检验现在要检验EX是否为是否为32.5.提出原假设和备择假设提出原假设和备择假设 第一步:第一步:X未知未知.第二步:第二步:能衡量差异能衡量差异大小且分布大小且分布取一检验统计量,在取一检验统计量,在H0成立下成立下求出它的分布求出它的分布第三步:第三步:即即“”是一个小概率事件是一个小概率事件.小概率事件在一次小概率事件在一次试验中基本上不会试验中基本上不会发生发生.对给定的显著性水平对给定的显著性水平 =0.01,查表确,查表确定临界值定临界值,使使得否认域得
17、否认域 W:|t|4.0322得否认域得否认域 W:|t|4.0322故不能拒绝故不能拒绝H0.第四步:第四步:将样本值代入算出统计量将样本值代入算出统计量 t 的实测值的实测值,|t|=2.9972.33故拒绝原假设故拒绝原假设H0.落入否认域落入否认域解解:提出假设提出假设:取统计量取统计量否定域为否定域为 W:=2.33 例例4 为比较两台自动机床的精度,分别取容为比较两台自动机床的精度,分别取容量为量为10和和8的两个样本,测量某个指标的尺的两个样本,测量某个指标的尺寸假定服从正态分布,得到以下结果:寸假定服从正态分布,得到以下结果:在在 =0.1时,时,问这两台机床是否有同样的问这两
18、台机床是否有同样的精度精度?车床甲:车床甲:1.08,1.10,1.12,1.14,1.15,1.25,1.36,1.38,1.40,1.42车床乙:车床乙:1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38解解:设设两台自动机床的方差分别为两台自动机床的方差分别为在在 =0.1 =0.1下检验假设下检验假设:其中其中 为两样本的样本方差为两样本的样本方差取统计量取统计量否定域为否定域为 W:或或由样本值可计算得由样本值可计算得F的实测值为的实测值为:查表得查表得由于由于 0.3041.513.68,故接受故接受H0 .否定域为否定域为 W:或或F=1.51这时可能
19、犯第二类错误这时可能犯第二类错误.想知道如何计算犯第二类错误的概率,想知道如何计算犯第二类错误的概率,再请看演示再请看演示 两类错误的概率的关系两类错误的概率的关系关于特性曲线的内容关于特性曲线的内容.其它情况可参看书上表其它情况可参看书上表 p252,否认,否认域请自己写出域请自己写出.注意:我们讨论的是正态总体均值和注意:我们讨论的是正态总体均值和方差的假设检验,或样本容量较大,可用方差的假设检验,或样本容量较大,可用正态近似的情形正态近似的情形.下面我们对本讲内容作简单小结下面我们对本讲内容作简单小结.提出提出假设假设 根据统计调查的目的根据统计调查的目的,提出提出原假设原假设H0 和备
20、选假设和备选假设H1作出作出决策决策抽取抽取样本样本检验检验假设假设 对差异进行定量的分析,对差异进行定量的分析,确定其性质确定其性质是随机误差是随机误差还是系统误差还是系统误差.为给出两为给出两者界限,找一检验统计量者界限,找一检验统计量T,在在H0成立下其分布成立下其分布.拒绝还是不能拒绝还是不能拒绝拒绝H0显著性显著性水平水平P(T W)=-犯第一犯第一类错误的概率,类错误的概率,W为拒绝域为拒绝域总总 结结在大样本的条件下,假设能求得检验统计量的在大样本的条件下,假设能求得检验统计量的极限分布,依据它去决定临界值极限分布,依据它去决定临界值C.F 检验检验 用用 F分布分布一般说来,按
21、照检验所用的统计量一般说来,按照检验所用的统计量,分分为为U 检验检验 用正态分布用正态分布t 检验检验 用用 t 分布分布检验检验用用分布分布 按照原假设或对立假设的提法,分为按照原假设或对立假设的提法,分为单侧检验,它的舍弃域取在左侧或右侧单侧检验,它的舍弃域取在左侧或右侧.双侧检验,它的舍弃域取在两侧双侧检验,它的舍弃域取在两侧;假设想了解假设想了解“检验的检验的p值这局部内容,请值这局部内容,请看教案看教案“第第31讲续讲续.9、静夜四无邻,荒居旧业贫。4月-234月-23Tuesday,April 18,202310、雨中黄叶树,灯下白头人。06:58:1906:58:1906:58
22、4/18/2023 6:58:19 AM11、以我独沈久,愧君相见频。4月-2306:58:1906:58Apr-2318-Apr-2312、故人江海别,几度隔山川。06:58:1906:58:1906:58Tuesday,April 18,202313、乍见翻疑梦,相悲各问年。4月-234月-2306:58:1906:58:19April 18,202314、他乡生白发,旧国见青山。18 四月 20236:58:19 上午06:58:194月-2315、比不了得就不比,得不到的就不要。四月 236:58 上午4月-2306:58April 18,202316、行动出成果,工作出财富。2023
23、/4/18 6:58:1906:58:1918 April 202317、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。6:58:19 上午6:58 上午06:58:194月-239、没有失败,只有暂时停止成功!。4月-234月-23Tuesday,April 18,202310、很多事情努力了未必有结果,但是不努力却什么改变也没有。06:58:1906:58:1906:584/18/2023 6:58:19 AM11、成功就是日复一日那一点点小小努力的积累。4月-2306:58:1906:58Apr-2318-Apr-2312、世间成事,不求其绝对圆满,留一份缺乏,可得无
24、限完美。06:58:1906:58:1906:58Tuesday,April 18,202313、不知香积寺,数里入云峰。4月-234月-2306:58:1906:58:19April 18,202314、意志坚强的人能把世界放在手中像泥块一样任意揉捏。18 四月 20236:58:19 上午06:58:194月-2315、楚塞三湘接,荆门九派通。四月 236:58 上午4月-2306:58April 18,202316、少年十五二十时,步行夺得胡马骑。2023/4/18 6:58:1906:58:1918 April 202317、空山新雨后,天气晚来秋。6:58:19 上午6:58 上午0
25、6:58:194月-239、杨柳散和风,青山澹吾虑。4月-234月-23Tuesday,April 18,202310、阅读一切好书如同和过去最杰出的人谈话。06:58:1906:58:1906:584/18/2023 6:58:19 AM11、越是没有本领的就越加自命非凡。4月-2306:58:1906:58Apr-2318-Apr-2312、越是无能的人,越喜欢挑剔别人的错儿。06:58:1906:58:1906:58Tuesday,April 18,202313、知人者智,自知者明。胜人者有力,自胜者强。4月-234月-2306:58:1906:58:19April 18,202314、
26、意志坚强的人能把世界放在手中像泥块一样任意揉捏。18 四月 20236:58:19 上午06:58:194月-2315、最具挑战性的挑战莫过于提升自我。四月 236:58 上午4月-2306:58April 18,202316、业余生活要有意义,不要越轨。2023/4/18 6:58:1906:58:1918 April 202317、一个人即使已登上顶峰,也仍要自强不息。6:58:19 上午6:58 上午06:58:194月-23MOMODA POWERPOINTLorem ipsum dolor sit amet,consectetur adipiscing elit.Fusce id urna blandit,eleifend nulla ac,fringilla purus.Nulla iaculis tempor felis ut cursus.感感 谢谢 您您 的的 下下 载载 观观 看看专家告诉