第五章 统计推断(1).ppt

上传人:qwe****56 文档编号:73169865 上传时间:2023-02-16 格式:PPT 页数:35 大小:499KB
返回 下载 相关 举报
第五章 统计推断(1).ppt_第1页
第1页 / 共35页
第五章 统计推断(1).ppt_第2页
第2页 / 共35页
点击查看更多>>
资源描述

《第五章 统计推断(1).ppt》由会员分享,可在线阅读,更多相关《第五章 统计推断(1).ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第五章第五章 统计推断统计推断第四章我们学到第四章我们学到从总体到样本从总体到样本的方向,即抽样分的方向,即抽样分布问题,讲述从理论分布中抽出的样本统计数的变布问题,讲述从理论分布中抽出的样本统计数的变异特点。异特点。5.1 5.1 统计假设测验的基本原理统计假设测验的基本原理一、统计推断的意义和内容一、统计推断的意义和内容 本章将讨论从本章将讨论从样本到总体样本到总体的方向,就是从一个样的方向,就是从一个样本或一系列样本结果去推断其总体结果,即统计推本或一系列样本结果去推断其总体结果,即统计推断问题。断问题。试验实践中所获得的资料,通常都是样本的结试验实践中所获得的资料,通常都是样本的结果,

2、而我们希望了解的却是抽得样本的总体。果,而我们希望了解的却是抽得样本的总体。因此,统计推断是科研工作中一个十分重要的因此,统计推断是科研工作中一个十分重要的工具,对试验设计也有指导意义。工具,对试验设计也有指导意义。统计推断统计推断(statistical inference)(statistical inference):就是根据抽样分布规律和概率理论,由样本结就是根据抽样分布规律和概率理论,由样本结果果(统计数统计数)来推断总体特征来推断总体特征(参数参数)。统计假设测验:统计假设测验:就是根据某种实际需要,对未知就是根据某种实际需要,对未知的或不完全知道的统计总体提出一些假设,然后由的或

3、不完全知道的统计总体提出一些假设,然后由样本的实际结果,经过一定的计算,做出在概率意样本的实际结果,经过一定的计算,做出在概率意义上应当接受哪种假设的测验。义上应当接受哪种假设的测验。统计推断包括:统计推断包括:统计假设测验(统计假设测验(hypothesis testhypothesis test)参数估计(参数估计(parameter estimateparameter estimate)如,某地进行了两个水稻品种对比试验,在如,某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植相同条件下,两个水稻品种分别种植1010个小区,个小区,获得两个水稻品种的平均亩产量为获得两个水

4、稻品种的平均亩产量为:我们能否根据我们能否根据就判定这两个水稻就判定这两个水稻品种平均产量不同?品种平均产量不同?结论是,不一定。结论是,不一定。kgkgkgkg 是指由样本统计数对总体参数做出点估计和区是指由样本统计数对总体参数做出点估计和区间估计。间估计。参数估计参数估计(point(point setimatesetimate):点估计:点估计:就是以统计数估计相应参数。就是以统计数估计相应参数。如以一个小麦品种的样本所得的如以一个小麦品种的样本所得的平均产量平均产量作为作为总总体参数体参数的估计值。但是点估计总是有一定偏误的。的估计值。但是点估计总是有一定偏误的。为了确定这个偏误的程度

5、和总体参数的所在,我为了确定这个偏误的程度和总体参数的所在,我们可以进行区间估计。们可以进行区间估计。是指以一定的概率保证总体参数位于某两是指以一定的概率保证总体参数位于某两个数值之间。个数值之间。区间估计:区间估计:如,某一水稻品种的亩产量如,某一水稻品种的亩产量落在落在(700kg-800kg)(700kg-800kg)区间的概率为区间的概率为9595。如何确切地证实假设是正确的还是错误的呢如何确切地证实假设是正确的还是错误的呢?当然可以把全部产品逐个检验,这种研究全部总体当然可以把全部产品逐个检验,这种研究全部总体方法当然是很准确的,但往往是行不通的。方法当然是很准确的,但往往是行不通的

6、。二、统计假设测验的基本步骤二、统计假设测验的基本步骤进行统计假设测验,首先要对统计总体提出假设,进行统计假设测验,首先要对统计总体提出假设,统计假设统计假设(statistical hypothesis):就是试验工作者提出有关某一总体参数的假设。就是试验工作者提出有关某一总体参数的假设。如果通过测验证明假设与试验结果相符,则该如果通过测验证明假设与试验结果相符,则该假设就被接受;反之,如果假设与试验结果不相假设就被接受;反之,如果假设与试验结果不相符,则该假设就被否定符,则该假设就被否定 因此,我们不得不采用另一种方法,即因此,我们不得不采用另一种方法,即研究样研究样本本。也就是。也就是抽

7、取样本抽取样本进行检验,推断这批产品是进行检验,推断这批产品是否合格。否合格。这种方法也叫显著性测验,因为试验的结果在这种方法也叫显著性测验,因为试验的结果在习惯上用显著、极显著或不显著来表示。习惯上用显著、极显著或不显著来表示。基本步骤:基本步骤:统计假设测验:统计假设测验:首先首先要对统计总体提出假设;要对统计总体提出假设;然后然后根据试验的数据去证明假设的正确与否?根据试验的数据去证明假设的正确与否?H H0 0和和H HA A是对立的假设,如果接受是对立的假设,如果接受H H0 0就否定就否定 H HA A,如,如果否定果否定H H0 0就接受就接受H HA A。*对统计总体的两个假设

8、对统计总体的两个假设1.1.无效假设无效假设(null hypothesis)(null hypothesis)假设总体参数与某一指定值相等或假设两个总体假设总体参数与某一指定值相等或假设两个总体参数相等,即假设其没有效应,这一假设称为无效参数相等,即假设其没有效应,这一假设称为无效假设,记作假设,记作H H0 02.2.对应假设对应假设 (alternative hypothesis)无效假设相对应的另一统计假设,叫对应假设或无效假设相对应的另一统计假设,叫对应假设或备择假设,记作备择假设,记作H HA A。测验前提出无效假设的目的测验前提出无效假设的目的在于,可从假设的总在于,可从假设的总

9、体里推论其体里推论其平均数平均数的随机抽样分布,从而算出某一的随机抽样分布,从而算出某一样本平均数样本平均数指定值出现的概率,进而研究样本与总指定值出现的概率,进而研究样本与总体的关系,作为假设测验的理论依据。体的关系,作为假设测验的理论依据。无论是平均数,百分数,还是变异数的统计假设,无论是平均数,百分数,还是变异数的统计假设,均应在试验前按研究目的提出。均应在试验前按研究目的提出。H H0 0的形式和内容可的形式和内容可以多种多样,但必须遵循以多种多样,但必须遵循两个原则:两个原则:有实际意义;有实际意义;据之可以算出因据之可以算出因抽样误差抽样误差而获得样本结果的概率。而获得样本结果的概

10、率。【例例5 51 1】设一水稻地方品种一般亩产为设一水稻地方品种一般亩产为500kg500kg,方差为,方差为324kg324kg,现有一新品种对其抽查了,现有一新品种对其抽查了 9 9个试验小区,个试验小区,测得样本平均亩产为测得样本平均亩产为515kg515kg,问:这样本是否从,问:这样本是否从亩产为亩产为500kg500kg的总体中随机抽出的?差数的总体中随机抽出的?差数15kg15kg究究竟是抽样误差造成的竟是抽样误差造成的?还是确实有差异还是确实有差异?无效假设必须是有意义的,无效假设必须是有意义的,即在假设的前提下可以即在假设的前提下可以确定试验结果的概率的。确定试验结果的概率

11、的。1 1提出统计假设提出统计假设体平均数体平均数 ,即,即等于原地方品种的总等于原地方品种的总 假设新品种的总体平均数假设新品种的总体平均数 乃是随机误差乃是随机误差;假设新品种的总体平均数假设新品种的总体平均数,而样本平,而样本平kg5000=mm和和 之间的差数之间的差数均数均数0m据之才能算得因抽样误差而获得一个与据之才能算得因抽样误差而获得一个与 的相的相差差15kg15kg的的 的概率。的概率。则则H HA A是假设样本不是从已知总体中随机抽出的。是假设样本不是从已知总体中随机抽出的。对应假设:对应假设:在在 的假设下,我们就有一个具有平均的假设下,我们就有一个具有平均数数 00:

12、mm=H的的 分布,分布,即即 、方差、方差 N(500N(500,36)36);kg5000=mmx0:mmAH2.2.确定一个否定确定一个否定H H0 0的概率标准的概率标准 这个标准叫这个标准叫显著水平显著水平(significance level)(significance level),记,记做做。是人为定出的统计推断的小概率(显著)标准。是人为定出的统计推断的小概率(显著)标准。在生物学研究中常取在生物学研究中常取=0.05=0.05或或=0.01=0.01。显著水平的选择,应根据试验要求或试验结论的显著水平的选择,应根据试验要求或试验结论的重要性而定。重要性而定。显著水平显著水平

13、对假设测验结论是有直接影响的,所对假设测验结论是有直接影响的,所以应在试验开始前规定下来,在试验结果分析时不以应在试验开始前规定下来,在试验结果分析时不能随意改变。能随意改变。3.3.假设正确的前提下,研究样本平均数的抽样分布假设正确的前提下,研究样本平均数的抽样分布 算出试验所得的平均数出现的概率有多大,即算出算出试验所得的平均数出现的概率有多大,即算出实得结果由抽样误差造成的概率。或者划出接受区域实得结果由抽样误差造成的概率。或者划出接受区域和否定区域。二法选一即可。和否定区域。二法选一即可。(1)(1)计算概率的方法计算概率的方法查附表查附表2 2,在在 的总体中,如以的总体中,如以n=

14、9n=9作随机抽样,抽得作随机抽样,抽得一个与一个与500kg500kg相差达相差达15kg15kg以上的的以上的的概率概率为为0.01240.0124。5000=m在在 的假设下可算得:的假设下可算得:00:mm=H(2)(2)划接受区域和否定区域的方法划接受区域和否定区域的方法根据上章所述根据上章所述 和和 的分布,我们知道:的分布,我们知道:因此,在因此,在 的抽样分布中,落在的抽样分布中,落在区间内的区间内的 有有9595,落在这一区间外的落在这一区间外的 只有只有5%5%。如果以如果以5 5的概率作为接受或否定的概率作为接受或否定H H0 0的界限,则前者的界限,则前者为接受假设的区

15、域为接受假设的区域,简称简称接受区域接受区域;后者为否定假设的;后者为否定假设的区域,简称区域,简称否定区域否定区域。两个否定区域的临界值。两个否定区域的临界值。而而 为两个否定为两个否定H H0 0区域。区域。界界值写值写 ,即当即当 在在()()区区 在在u u测验时,一般将否定区域和接受区域的两个临测验时,一般将否定区域和接受区域的两个临间内为接受间内为接受H H0 0区域;区域;然后从然后从 加上加上所以在测验时需先计算所以在测验时需先计算 ,m,(计算时计算时 用用 代替代替),5000=m和减去和减去m即得即得图图5.1 5.1 在在=0.05=0.05水平上接受或否定水平上接受或

16、否定H H0 0的几何意义的几何意义4.4.根据根据“小概率实际不可能性原理小概率实际不可能性原理”接受或否定假接受或否定假设设 概率很小的事件,在一次试验中概率很小的事件,在一次试验中几乎几乎不可能发生不可能发生或可以认为或可以认为不可能发生不可能发生。若我们假设了一些条件,并在假设的条件下能够若我们假设了一些条件,并在假设的条件下能够准确地算出事件准确地算出事件A A出现的概率很小出现的概率很小,但在实际一次试但在实际一次试验中,事件验中,事件A A竟出现了,那么竟出现了,那么,我们可以认为这个假我们可以认为这个假设是设是错误错误的,从而的,从而否定这个假设否定这个假设。“小概率实际不可能

17、性原理小概率实际不可能性原理”根据这一原理,当根据这一原理,当根据这一原理,当根据这一原理,当表面差异表面差异表面差异表面差异是抽样误差的概率小是抽样误差的概率小是抽样误差的概率小是抽样误差的概率小于于于于0.050.050.050.05时,可以认为在一次抽样中时,可以认为在一次抽样中时,可以认为在一次抽样中时,可以认为在一次抽样中表面差异是抽样表面差异是抽样表面差异是抽样表面差异是抽样误差误差误差误差实际上是不可能的,因而实际上是不可能的,因而实际上是不可能的,因而实际上是不可能的,因而否定否定否定否定原先所作的无效原先所作的无效原先所作的无效原先所作的无效假设假设假设假设 H H H H0

18、 0 0 0:接受备择假设接受备择假设接受备择假设接受备择假设H H H HA A A A:,即认为存在真实差异。,即认为存在真实差异。,即认为存在真实差异。,即认为存在真实差异。当表面差异是抽样误差的概率大于当表面差异是抽样误差的概率大于0.050.05时,说时,说明无效假设明无效假设H H0 0:成立的可能性大,不能成立的可能性大,不能被否定,因而也就不能接受备择假被否定,因而也就不能接受备择假H HA A:。对例对例5.15.1已算得已算得 ,也可根据接受区域和否定区域作出推断,例也可根据接受区域和否定区域作出推断,例5 5.1 1所所得,得,已落入否定区域,所以已落入否定区域,所以我们

19、冒我们冒5 5以下的风险否定以下的风险否定H H0 0。所以结沦是否定所以结沦是否定H H0 0,即该水稻新品种亩产的总体平均,即该水稻新品种亩产的总体平均数数 与原地方品种亩产的总体平均数与原地方品种亩产的总体平均数 有显著差异。有显著差异。m0m如果取如果取=0.01=0.01,则,则 ,不应否定不应否定H H0 0,可见,可见aP的选择是很重要的。的选择是很重要的。u u分布作假设测验时,实际算得的分布作假设测验时,实际算得的 就是在就是在=在实际测验时,计算可以简化。在实际测验时,计算可以简化。由于由于 ,。因此,在用。因此,在用0.050.05水平上差异显著,若水平上差异显著,若就是

20、在就是在=0.01=0.01水平上差异显著水平上差异显著(或称极显著或称极显著),不必再计算所得,不必再计算所得 u u值的确切概率。值的确切概率。综上所述,统计假设测验的步骤可总结如下:综上所述,统计假设测验的步骤可总结如下:(1)(1)提出无效假设提出无效假设H H0 0和备择假设和备择假设H HA A;(2)(2)确定显著水平确定显著水平;(3)(3)在在 H H0 0为正确的假设下,根据统计数的抽样分为正确的假设下,根据统计数的抽样分布规律,算出实得差异由误差造成的概率或划出否布规律,算出实得差异由误差造成的概率或划出否定区域;定区域;(4)(4)将算得的概率和将算得的概率和 相比较,

21、或者将试验结果相比较,或者将试验结果和否定区域相比较,从而作出接受或否定假设的推和否定区域相比较,从而作出接受或否定假设的推断。断。这种这种这种这种利用两尾概率进行的检验叫利用两尾概率进行的检验叫利用两尾概率进行的检验叫利用两尾概率进行的检验叫两尾检验两尾检验两尾检验两尾检验。三、两尾测验与一尾测验三、两尾测验与一尾测验 的备择假设为的备择假设为的备择假设为的备择假设为H H H HA A A A:。:。:。:。H H H HA A A A实际上包含了或实际上包含了或实际上包含了或实际上包含了或 这两种情况。这两种情况。这两种情况。这两种情况。此时,此时,此时,此时,水平上否定域为水平上否定域

22、为水平上否定域为水平上否定域为 和和和和 ,的概率为的概率为的概率为的概率为 ,如,如,如,如图图图图5-15-15-15-1所示。所示。所示。所示。在在在在【例例例例51515151】中,对应于无效假设中,对应于无效假设中,对应于无效假设中,对应于无效假设H H H H0 0 0 0:对称地分配在对称地分配在对称地分配在对称地分配在u u u u分布曲线的两侧尾部,每侧尾部分布曲线的两侧尾部,每侧尾部分布曲线的两侧尾部,每侧尾部分布曲线的两侧尾部,每侧尾部图图5.1 5.1 在在=0.05=0.05水平上接受或否定水平上接受或否定H H0 0的几何意义的几何意义在某些情况下,两尾测验不一定符

23、合实际需要。在某些情况下,两尾测验不一定符合实际需要。2 2一尾测验一尾测验 例如某种农药防治蚜虫的效果达到例如某种农药防治蚜虫的效果达到9090才合格,如才合格,如大于大于 时,无论大时,无论大果进行抽样测验,则在果进行抽样测验,则在多少,都不需要否定多少,都不需要否定H H0 0;但如但如 小于小于 ,却可能为一,却可能为一批不合格的药品,批不合格的药品,因此假设测验应为因此假设测验应为(即该药品合格即该药品合格),(药品不合格药品不合格)。这样,这样,否定区域就只有左尾否定区域就只有左尾。图图5.2a=0.055.2a=0.05,接受或否定接受或否定这时,否定区域就只有右尾,所得这时,否

24、定区域就只有右尾,所得u1.645u1.645就否定就否定H H0 0。国家规定稻米中某种农药成分的残留物含量应国家规定稻米中某种农药成分的残留物含量应国家规定稻米中某种农药成分的残留物含量应国家规定稻米中某种农药成分的残留物含量应低于低于低于低于0.1%0.1%0.1%0.1%()。)。)。)。可能有严重后果可能有严重后果合格合格则所作假设应为:则所作假设应为:图图5.2b=0.05,接受或否定,接受或否定四、统计假设测验的两种类型的错误四、统计假设测验的两种类型的错误 统计假设测验是根据一定的概率标准统计假设测验是根据一定的概率标准()(),由,由样本的结果对总体特征作出推断。因此,不论是

25、样本的结果对总体特征作出推断。因此,不论是接受接受H H0 0或否定或否定H H0 0都没有都没有100100的概率保证。的概率保证。规定规定=0.05=0.05为否定假设的概率标准,就是说我为否定假设的概率标准,就是说我们假设测验结论仅有们假设测验结论仅有9595的把握,同时却冒着的把握,同时却冒着5 5的下错误结论的风险。的下错误结论的风险。如果如果H H0 0是不真实的,我们通过测验却不能发现其是不真实的,我们通过测验却不能发现其不真实性而接受了它,即犯了一个不真实性而接受了它,即犯了一个接受不真实的接受不真实的H H0 0的错误的错误。通常把犯第二类错误的概率记作。通常把犯第二类错误的

26、概率记作,所以,所以这类错误又称作这类错误又称作错误错误。由于规定显著水平为由于规定显著水平为,故,故 H H0 0为真而被否定的概为真而被否定的概率仅为率仅为;因而这类错误又叫;因而这类错误又叫错误错误。如果如果 H H0 0是真实的,我们通过测验却否定了它,就是真实的,我们通过测验却否定了它,就犯了一个犯了一个否定真实假设的错误否定真实假设的错误。1.1.第一类错误第一类错误(first kind error)(first kind error)2.2.第二类错误第二类错误(second kind error)(second kind error)显著性检验的两类错误归纳如下:显著性检验的两类错误归纳如下:表表4-1 4-1 显著性检验的两类错误显著性检验的两类错误习习 题题1.1.教材习题:教材习题:5.1-5.45.1-5.4;2.2.无效假设必须遵循的两个原则是什么?无效假设必须遵循的两个原则是什么?3.3.简述统计假设测验的步骤。简述统计假设测验的步骤。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁