统计推断原理幻灯片.ppt

上传人:石*** 文档编号:48386725 上传时间:2022-10-06 格式:PPT 页数:58 大小:2.81MB
返回 下载 相关 举报
统计推断原理幻灯片.ppt_第1页
第1页 / 共58页
统计推断原理幻灯片.ppt_第2页
第2页 / 共58页
点击查看更多>>
资源描述

《统计推断原理幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计推断原理幻灯片.ppt(58页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计推断原理第1页,共58页,编辑于2022年,星期二本章主要介绍统计推断的意义、原理,统计推断与抽样分布的关系,统计推断的思路和一般步骤,两尾检验和一尾检验,统计推断可能犯的两类错误及防止方法第2页,共58页,编辑于2022年,星期二生物统计学的一个重要任务是要生物统计学的一个重要任务是要知道知道所研究总体的特征所研究总体的特征值(参数)值(参数)但是总体特征值一般难以知道:但是总体特征值一般难以知道:一方面是由于总体很一方面是由于总体很大大,即,即N 大,有时是大,有时是无限无限的(无限的(无限总体,总体,N ),因此不可能逐一调查清楚),因此不可能逐一调查清楚另一方面,有时所要研究的总体

2、目前并不存在,或者只另一方面,有时所要研究的总体目前并不存在,或者只能说是能说是虚拟虚拟存在(总体是虚的),无法进行调查存在(总体是虚的),无法进行调查作某一试验时更是如此作某一试验时更是如此 第3页,共58页,编辑于2022年,星期二但不管是何种类型的总体,我们总是可以通过随机抽样但不管是何种类型的总体,我们总是可以通过随机抽样(抽样调查)的方法获得该总体的随机样本(抽样调查)的方法获得该总体的随机样本通过通过统计推断统计推断来定性或定量地分析所研究总体的特征值来定性或定量地分析所研究总体的特征值统计推断就是用统计推断就是用样本的特征值样本的特征值(统计量)在一定的(统计量)在一定的概率概率

3、保证保证下下推断推断相应相应总体的特征值总体的特征值(参数)(参数)即:随机抽样即:随机抽样 随机样本随机样本 随机样本特征值随机样本特征值 总体特征值总体特征值 (统计量)(统计量)(参数)(参数)计算估计第4页,共58页,编辑于2022年,星期二第一节第一节 统计推断的意义和内容统计推断的意义和内容第5页,共58页,编辑于2022年,星期二所谓统计推断(所谓统计推断(statistical inference),就是),就是根据统计根据统计量的分布和概率理论,由样本统计量来推断总体的参数量的分布和概率理论,由样本统计量来推断总体的参数实际工作中,一次试验或一次调查所获得的数据资料,实际工作

4、中,一次试验或一次调查所获得的数据资料,通常是一个样本的结果,而我们真正需要知道的是抽通常是一个样本的结果,而我们真正需要知道的是抽取样本的总体特征取样本的总体特征第6页,共58页,编辑于2022年,星期二即:统计分析的结论是针对即:统计分析的结论是针对总体参数总体参数而言的,因此,统而言的,因此,统计推断是科研工作中一个十分重要的工具,对试验设计也计推断是科研工作中一个十分重要的工具,对试验设计也有很大的指导意义有很大的指导意义统计推断包括:统计推断包括:统计假设检验(统计假设检验(hypothesis test)参数估计(参数估计(parametric estimation)这样两部分内容

5、这样两部分内容 第7页,共58页,编辑于2022年,星期二统计假设检验又称显著性检验(统计假设检验又称显著性检验(significance test)其原理和过程是:其原理和过程是:对未知的或不完全知道的总体参数提出一些对未知的或不完全知道的总体参数提出一些假设假设(hypothesis 这些假设通常构成完全事件系),然后在这些假设通常构成完全事件系),然后在某一某一基本假设基本假设的基础上,的基础上,计算计算样本的统计量,并分析这样本的统计量,并分析这一统计量的一统计量的分布规律分布规律最后根据这一统计量作出在一定概率意义下应当最后根据这一统计量作出在一定概率意义下应当接受接受何种何种假设的

6、结论假设的结论第8页,共58页,编辑于2022年,星期二这里有一个这里有一个定量定量转化为转化为定性定性的过程:的过程:经计算所得到的统计量一般是呈经计算所得到的统计量一般是呈连续分布连续分布的(定量),但的(定量),但最后的检验结论只有两种:接受最后的检验结论只有两种:接受何种假设何种假设(定性)(定性)即:存在一个即:存在一个临界值临界值,统计量未达到临界值,应当接受一种,统计量未达到临界值,应当接受一种假设假设统计量超过临界值,应当接受另一种假设统计量超过临界值,应当接受另一种假设第9页,共58页,编辑于2022年,星期二参数估计包括两部分内容:参数估计包括两部分内容:参数的参数的点估计

7、点估计(point estimation)参数的参数的区间估计区间估计(interval estimation)第10页,共58页,编辑于2022年,星期二第二节第二节 统计量的抽样分布与统计推断的关统计量的抽样分布与统计推断的关系系第11页,共58页,编辑于2022年,星期二前面已经讲过,由样本的统计量组成的总体分布(抽前面已经讲过,由样本的统计量组成的总体分布(抽样分布)其参数与原总体的相应参数有着很密切的样分布)其参数与原总体的相应参数有着很密切的关系关系同时抽样的结果还告诉我们,样本统计量与总体相应参数之同时抽样的结果还告诉我们,样本统计量与总体相应参数之间存在着一定的间存在着一定的抽

8、样误差抽样误差因此,用样本来推断总体的准确性与抽样误差的因此,用样本来推断总体的准确性与抽样误差的大小大小有关,抽样误差的大小用有关,抽样误差的大小用标准误标准误来衡量来衡量第12页,共58页,编辑于2022年,星期二标准误不仅反映了抽样误差的标准误不仅反映了抽样误差的大小大小,而且反映了样本统计,而且反映了样本统计量与总体相应参数间的量与总体相应参数间的差异程度差异程度也反映了用某个样本统计量来估计总体参数的也反映了用某个样本统计量来估计总体参数的准确程度准确程度第13页,共58页,编辑于2022年,星期二第三节第三节 统计假设检验统计假设检验第14页,共58页,编辑于2022年,星期二一、

9、统计假设检验的基本思路一、统计假设检验的基本思路为了说明问题,我们举几个例子进行讨论为了说明问题,我们举几个例子进行讨论例例1、随机抽取一批小鼠,随机分为两组,一组注射催产素,一、随机抽取一批小鼠,随机分为两组,一组注射催产素,一组作为对照(即不注射催产素),半小时后检查这两组小鼠组作为对照(即不注射催产素),半小时后检查这两组小鼠的血糖含量,得:注射催产素组为:的血糖含量,得:注射催产素组为:=106.88 对照组平均值对照组平均值为:为:=109.17 同时我们也发现,同一组内的小鼠其血糖含量也是不同的同时我们也发现,同一组内的小鼠其血糖含量也是不同的两组小鼠的平均血糖含量之间有个差:两组

10、小鼠的平均血糖含量之间有个差:那么我们是否可以认为这个差值就是由于催产素注射与否的结那么我们是否可以认为这个差值就是由于催产素注射与否的结果?显然仅凭这一差值果?显然仅凭这一差值-2.29 是不能说明问题的是不能说明问题的第15页,共58页,编辑于2022年,星期二例例2、比较不同日龄(、比较不同日龄(d)正常白化小鼠血浆含)正常白化小鼠血浆含 N 量,得如下一批数量,得如下一批数据:据:日龄日龄 血浆含血浆含 N 量量35d()0.98 0.83 0.94 0.90 0.99 0.92 0.87 0.86 0.8190d()1.00 1.08 0.97 0.93 1.03 0.94 1.11

11、 1.10对这两组数据进行计算,得:对这两组数据进行计算,得:35d 组小鼠的组小鼠的90d 组小鼠的组小鼠的发现两组小鼠的血浆含发现两组小鼠的血浆含 N 量有差异:量有差异:那么我们能否仅凭这一差异就认为日龄的不同,其血浆含那么我们能否仅凭这一差异就认为日龄的不同,其血浆含 N量就有差量就有差异呢?异呢?35d 的小鼠中也有含的小鼠中也有含 N 量高的(如量高的(如 0.99 0.98 0.94)90d 的小鼠中也有含的小鼠中也有含 N 量低的(如量低的(如 0.93 0.94)即:同一组内的小鼠其血浆含即:同一组内的小鼠其血浆含 N 量之间也是有差异的量之间也是有差异的第16页,共58页,

12、编辑于2022年,星期二例例3、某药厂宣传说该厂生产的治鱼链球菌病的新药其疗效为、某药厂宣传说该厂生产的治鱼链球菌病的新药其疗效为 90%,我们能轻易相信吗?是否需要做一个试验?如果试验结果是,我们能轻易相信吗?是否需要做一个试验?如果试验结果是 100 尾鱼仅康复了尾鱼仅康复了 88 尾(尾(p=0.88),我们就能对该厂的宣传效),我们就能对该厂的宣传效果进行否定吗?果进行否定吗?如果我们再做一次呢?我们能一直不断地做下去吗?如果我们再做一次呢?我们能一直不断地做下去吗?例例4、试验某种治疗鱼竖鳞病的新药,将其与常规药物相比较,对、试验某种治疗鱼竖鳞病的新药,将其与常规药物相比较,对 40

13、0 尾鱼施用常规药物,康复了尾鱼施用常规药物,康复了 340 尾(康复率尾(康复率 ),相),相应的,对应的,对 500 尾鱼施用新药,有尾鱼施用新药,有 435 尾康复了(康复率尾康复了(康复率 ),我们是否就可以认为新药一定好于常规药物?),我们是否就可以认为新药一定好于常规药物?第17页,共58页,编辑于2022年,星期二以上几个例题提醒我们,有以下几个以上几个例题提醒我们,有以下几个问题问题是需要我们是需要我们加以注意的:加以注意的:a.我们不可能用我们不可能用总体总体来做试验,各方面的条件不许可我来做试验,各方面的条件不许可我们这样做,也没有必要这样做们这样做,也没有必要这样做b.我

14、们只能用我们只能用样本样本来做试验,且由于时间、经费、人力来做试验,且由于时间、经费、人力等因素的限制,一般同一个试验只能做一次,通过等因素的限制,一般同一个试验只能做一次,通过一一次试验次试验就希望能得到一个比较可靠的结果就希望能得到一个比较可靠的结果c.试验结束以后,用试验结束以后,用什么什么来作为检验的对象?那就是来作为检验的对象?那就是样样本本的的平均值平均值:第18页,共58页,编辑于2022年,星期二用样本的平均值来检验总体平均值用样本的平均值来检验总体平均值用两个样本平均值的差异来检验相应两个总体平均值的差异用两个样本平均值的差异来检验相应两个总体平均值的差异用样本平均值作为检验

15、对象的理由是:用样本平均值作为检验对象的理由是:1、我们已经证明了、我们已经证明了 为为最小最小,这说明样本平均值,这说明样本平均值 与各变量与各变量 的差异最小,因此的差异最小,因此 是样本资料最好的是样本资料最好的代表代表2、在抽样分布中,我们已经证明了样本平均值、在抽样分布中,我们已经证明了样本平均值 是总是总体平均值体平均值 的的无偏估计量无偏估计量,即,即 的数学期望是的数学期望是3、中心极限定理告诉我们:样本平均值、中心极限定理告诉我们:样本平均值 服从或近似服服从或近似服从从正态分布正态分布 第19页,共58页,编辑于2022年,星期二上述三点,说明样本平均值上述三点,说明样本平

16、均值 可以作为检验的对象可以作为检验的对象但是我们又不能但是我们又不能仅仅凭样本平均值的大小就贸然下结论,凭样本平均值的大小就贸然下结论,认为试验有效或试验无效认为试验有效或试验无效我们必须通过我们必须通过检验检验(test)为什么?为什么?因为任何一次试验都存在误差,即同一组内的观测值都因为任何一次试验都存在误差,即同一组内的观测值都不会完全相同,在正常试验条件下,同一组内的数据不会完全相同,在正常试验条件下,同一组内的数据之间的差异,一般就是误差之间的差异,一般就是误差第20页,共58页,编辑于2022年,星期二每一个观测值都是试验的表观效应,每一个数据都可以分每一个观测值都是试验的表观效

17、应,每一个数据都可以分成两个部分,即试验(处理)效应和误差(各种偶然因成两个部分,即试验(处理)效应和误差(各种偶然因素引起的差异)素引起的差异)同一总体中的个体所受到的各种偶然因素是不等的同一总体中的个体所受到的各种偶然因素是不等的每一个数据中所包含的偶然因素是独立的每一个数据中所包含的偶然因素是独立的就总体而言,这种偶然因素的影响是相互抵消的就总体而言,这种偶然因素的影响是相互抵消的用统计学自己的语言来讲,就是:用统计学自己的语言来讲,就是:每一个观测值都有自己每一个观测值都有自己独立的试验误差独立的试验误差第21页,共58页,编辑于2022年,星期二因此,我们有以下公式存在:因此,我们有

18、以下公式存在:观测值(表观效应)观测值(表观效应)=处理效应处理效应+误差效应误差效应 即:即:进行样本平均,得:进行样本平均,得:同样,两个样本平均值的差异也可以这样分解:同样,两个样本平均值的差异也可以这样分解:实际上,我们感兴趣的、即我们关心的重点是:实际上,我们感兴趣的、即我们关心的重点是:我们试验所得到的表观效应主要是由我们试验所得到的表观效应主要是由处理效应处理效应所引起、所引起、还是由还是由抽样误差抽样误差所引起?应当进行所引起?应当进行权衡权衡第22页,共58页,编辑于2022年,星期二结合上面的实例:结合上面的实例:两组小鼠的平均血糖含量之间的差异是否的确由催产素两组小鼠的平

19、均血糖含量之间的差异是否的确由催产素的注射与否所引起?的注射与否所引起?不同日龄正常白化小鼠血浆含不同日龄正常白化小鼠血浆含N量的差异是否的确由于量的差异是否的确由于小鼠的日龄不同而引起?小鼠的日龄不同而引起?实际试验中鱼链球菌病的治愈率与厂家宣传之间的差异实际试验中鱼链球菌病的治愈率与厂家宣传之间的差异的确是真实差异吗?即厂家是否真的言过其实了?还的确是真实差异吗?即厂家是否真的言过其实了?还是的确是试验时的抽样误差?是的确是试验时的抽样误差?新药和常规药之间的差异是否的确由偶然因素所引起?新药和常规药之间的差异是否的确由偶然因素所引起?第23页,共58页,编辑于2022年,星期二为了使得这

20、种比较和权衡所得到的结论更可靠、更科学、为了使得这种比较和权衡所得到的结论更可靠、更科学、更合理、更可信、更正确,必须对试验和统计分析提出更合理、更可信、更正确,必须对试验和统计分析提出如下要求:如下要求:1、合理合理地进行试验设计,地进行试验设计,正确正确地进行试验操作,地进行试验操作,无误无误地地进行抽样,进行抽样,仔细仔细地进行记录,地进行记录,认真认真地进行校对,以地进行校对,以有效有效地降低试验误差,尽可能地降低试验误差,尽可能避免避免系统误差,系统误差,杜绝杜绝人人为错误,使样本真正代表总体,对试验效应和试验误差为错误,使样本真正代表总体,对试验效应和试验误差作出作出无偏无偏的估计

21、的估计2、合理合理地、地、正确正确地分析试验结果,以得出有关总体参地分析试验结果,以得出有关总体参数假设的统计推断数假设的统计推断第24页,共58页,编辑于2022年,星期二二二 统计假设检验的一般步骤统计假设检验的一般步骤我们以大样本资料或样本虽小但总体方差为已知的情况(我们以大样本资料或样本虽小但总体方差为已知的情况(u-test)来说明统计假设检验的一般步骤)来说明统计假设检验的一般步骤统计假设检验的基本原理和思路是这样的:统计假设检验的基本原理和思路是这样的:首先首先根据具体的试验目的提出一个假设根据具体的试验目的提出一个假设(hypothesis)(然后在假定这一假设成立(或正确)的

22、前提下进行试验,(然后在假定这一假设成立(或正确)的前提下进行试验,并取得数据)并取得数据)然后然后同样在这一假设成立(或正确)的前提下,对这些数据同样在这一假设成立(或正确)的前提下,对这些数据或资料进行统计分析,获得该假设成立(或正确)的概率或资料进行统计分析,获得该假设成立(或正确)的概率值值第25页,共58页,编辑于2022年,星期二最后最后根据所获得概率的大小判断所作假设是否成立:根据所获得概率的大小判断所作假设是否成立:a、如果所得概率较大,就表明我们、如果所得概率较大,就表明我们没有足够的理由来否没有足够的理由来否定定所作的假设,即我们必须接受这一假设;所作的假设,即我们必须接受

23、这一假设;b、如果所得概率很小,就表示这一假设不大可能成立,应、如果所得概率很小,就表示这一假设不大可能成立,应予以否定,从而接受这一假设的对立假设,即予以否定,从而接受这一假设的对立假设,即接受接受备择备择假设假设上面的上面的 a 和和 b 必有一条被否定,另一条被接受必有一条被否定,另一条被接受第26页,共58页,编辑于2022年,星期二尽管所计算的概率值是连续变化的,但我们往往设定一尽管所计算的概率值是连续变化的,但我们往往设定一个概率个概率临界值临界值(如(如 p=0.05、p=0.01等等),根据等等),根据所得概率值是大于所得概率值是大于 p=0.05、还是小于还是小于 p=0.0

24、5来决来决定所作假设是否成立(或正确)定所作假设是否成立(或正确)因此,概率值是连续分布的(定量),但假设的接受与否只因此,概率值是连续分布的(定量),但假设的接受与否只有两类(定性)有两类(定性)第27页,共58页,编辑于2022年,星期二这里我们首先复习一下这里我们首先复习一下 u 的概念:的概念:在这一式子中,显然在这一式子中,显然 与与 的距离越小,的距离越小,u 值就越小,值就越小,查标准正态分布表,得到的概率值越大,表明查标准正态分布表,得到的概率值越大,表明 出现出现的概率越大;反之,的概率越大;反之,与与 的距离越大,的距离越大,u 值就越大,值就越大,查标准正态分布表,得到的

25、概率值就越小,表明查标准正态分布表,得到的概率值就越小,表明 出现的概率就越小出现的概率就越小当这一概率小到一定程度时,我们就可以认为这一当这一概率小到一定程度时,我们就可以认为这一 似似乎不大可能在一次试验中出现,亦即这一乎不大可能在一次试验中出现,亦即这一 所在总体所在总体的平均值与设定总体的平均值的平均值与设定总体的平均值不等不等,即两个总体,即两个总体不是不是同一个总体同一个总体第28页,共58页,编辑于2022年,星期二反之,我们就没有理由认为反之,我们就没有理由认为 所在总体与所设定的总体不所在总体与所设定的总体不是同一个总体是同一个总体在统计检验中所设定的、用以作为资料分析和最终

26、判断基础在统计检验中所设定的、用以作为资料分析和最终判断基础的假设称为无效假设,的假设称为无效假设,无效假设无效假设又称为解消假设(又称为解消假设(null hypothesis),用),用 表示表示第29页,共58页,编辑于2022年,星期二所谓无效假设可以这样理解:我们的试验是无效的,即试验所谓无效假设可以这样理解:我们的试验是无效的,即试验结束以后,所得到的样本平均值并没有超出设定的总体范结束以后,所得到的样本平均值并没有超出设定的总体范围,即试验后得到的样本平均值其效果不见得好于原定的围,即试验后得到的样本平均值其效果不见得好于原定的效果,即样本平均值所在总体与原设定的总体其实是同一效

27、果,即样本平均值所在总体与原设定的总体其实是同一个总体,两者的平均值个总体,两者的平均值 和和 并没有本质的差异,两者并没有本质的差异,两者之间的差异是由抽样误差引起的之间的差异是由抽样误差引起的无效假设的写法:无效假设的写法:无效假设的含义就是:试验后所得到的样本平均值与原设定无效假设的含义就是:试验后所得到的样本平均值与原设定的已知总体的平均值之间的差异是由误差所引起的的已知总体的平均值之间的差异是由误差所引起的第30页,共58页,编辑于2022年,星期二即样本平均值所在总体与已知总体是同一总体即样本平均值所在总体与已知总体是同一总体无效假设在统计分析后有可能被接受,也有可能被否定无效假设

28、在统计分析后有可能被接受,也有可能被否定为了在无效假设被否定后有可以被接受的假设,我们还应当为了在无效假设被否定后有可以被接受的假设,我们还应当在无效假设设立的同时设立一个后备假设,这一后备假设在无效假设设立的同时设立一个后备假设,这一后备假设称为称为备择假设备择假设,用,用 表示表示即即 备择假设是无效假设被否定后必须被接受的备择假设是无效假设被否定后必须被接受的一个假设(下标一个假设(下标 A 是是 alternative 之意)之意)备择假设和无效假设是一对对立的假设,两者构成了备择假设和无效假设是一对对立的假设,两者构成了一个完全事件系一个完全事件系第31页,共58页,编辑于2022年

29、,星期二在根据所得到的概率值进行判断时:在根据所得到的概率值进行判断时:接受了无效假设,就自然摒弃了备择假设接受了无效假设,就自然摒弃了备择假设否定无效假设的同时,就必须接受备择假设否定无效假设的同时,就必须接受备择假设备择假设的含义是:样本所在总体与已知总体不是同备择假设的含义是:样本所在总体与已知总体不是同一个总体,即:所得样本并不来自于这一已知总体一个总体,即:所得样本并不来自于这一已知总体将两个假设写完全:将两个假设写完全:既可以是既可以是 ,也可以是,也可以是第32页,共58页,编辑于2022年,星期二在设立假设以后,研究样本平均数的抽样分布,分析在设立假设以后,研究样本平均数的抽样

30、分布,分析试验或调查所得样本平均值试验或调查所得样本平均值 出现的概率出现的概率我们会发现,样本平均值一般不会刚好等于已知总体的平我们会发现,样本平均值一般不会刚好等于已知总体的平均值,两者之间会有一定的差异,这一差异,有可能是均值,两者之间会有一定的差异,这一差异,有可能是抽样误差,也有可能是真实性差异,对此,我们需要借抽样误差,也有可能是真实性差异,对此,我们需要借助概率原理来进行判断助概率原理来进行判断进行这种判断可以从两个角度,即有两种方法:进行这种判断可以从两个角度,即有两种方法:一是假定一是假定 是正确的,在此前提下计算是正确的,在此前提下计算 出现的概出现的概率值,我们可以通过查

31、表的方式来完成:率值,我们可以通过查表的方式来完成:如果所得如果所得 u 值出现的概率较大,我们就必须接受值出现的概率较大,我们就必须接受第33页,共58页,编辑于2022年,星期二如果所得如果所得u值出现的概率较小,我们就应当放弃值出现的概率较小,我们就应当放弃 而而 接受接受 这里的概率大小,以这里的概率大小,以 =0.05 和和 =0.01作为两个临界值作为两个临界值二是在假定二是在假定 为正确的前提下,对为正确的前提下,对 的抽样划出一个区的抽样划出一个区间,这一区间称为接受区间,这一区间是有一定的概间,这一区间称为接受区间,这一区间是有一定的概率保证的率保证的这一区间之外的部分称为否

32、定区间这一区间之外的部分称为否定区间倘若倘若 落在接受区间内,我们就接受落在接受区间内,我们就接受 反之,倘若反之,倘若 落在接受区间外,我们就否定落在接受区间外,我们就否定 而接受而接受 第34页,共58页,编辑于2022年,星期二下面的是接受区间示意图:下面的是接受区间示意图:第35页,共58页,编辑于2022年,星期二设这一接受区间的概率保证为设这一接受区间的概率保证为95%,由于,由于 而而 即即将其变换,得:将其变换,得:为接受区间,其概率为为接受区间,其概率为 95%而而 和和 为否定区间,其概率之和为为否定区间,其概率之和为 5%同样,同样,为为 99%接受区间接受区间而而 和和

33、 为为 1%的否定区间的否定区间第36页,共58页,编辑于2022年,星期二在在 u-test 中中以以 为为 水平上否定无效假设的两个界限水平上否定无效假设的两个界限以以 为为 水平上否定无效假设的两个界限水平上否定无效假设的两个界限最后,根据最后,根据小概率事件实际不可能性原理小概率事件实际不可能性原理接受或否定无效接受或否定无效假设假设小概率事件实际不可能性原理是指在一次试验中,小概率事件实际不可能性原理是指在一次试验中,概率很小概率很小的事件实际上是不可能发生的的事件实际上是不可能发生的第37页,共58页,编辑于2022年,星期二因此当因此当 与与 之间的差异其概率小于之间的差异其概率

34、小于 时(我们以时(我们以 作为小概率的第一临界值),就可以认为这不是抽样误差,作为小概率的第一临界值),就可以认为这不是抽样误差,而是实质性差异,从而否定无效假设而是实质性差异,从而否定无效假设第38页,共58页,编辑于2022年,星期二现在我们将假设检验的几个步骤归纳一下:现在我们将假设检验的几个步骤归纳一下:提出假设,进行试验,并计算样本平均数抽样分布的离提出假设,进行试验,并计算样本平均数抽样分布的离差差 u 值值查相关附表,查出所得查相关附表,查出所得 u 值出现的概率值,并考察其是否值出现的概率值,并考察其是否大于预先设定的大于预先设定的 值值由小概率原理作出接受或否定无效假设的推

35、断,并结由小概率原理作出接受或否定无效假设的推断,并结合专业知识给出合理、科学的解释合专业知识给出合理、科学的解释需要注意的是,当所得概率小于需要注意的是,当所得概率小于 =0.05 以后,还需根以后,还需根据具体情况继续考察其是否小于据具体情况继续考察其是否小于 =0.01 第39页,共58页,编辑于2022年,星期二我们以一个实例来系统地说明假设检验的步骤:我们以一个实例来系统地说明假设检验的步骤:某品种正常鲤鱼每某品种正常鲤鱼每 100ml 血清中镁离子含量为血清中镁离子含量为 (数据已经过转换)(数据已经过转换)今抽查某渔场今抽查某渔场 20 尾尾 3 龄鲤鱼的血清镁离子,得如下数龄鲤

36、鱼的血清镁离子,得如下数据(数据已经过转换):据(数据已经过转换):2.4 2.3 2.2 2.0 2.7 2.1 2.3 2.8 2.5 2.62.1 2.3 2.5 2.1 2.0 2.5 2.2 2.4 2.3 2.8试问,这批鲤鱼的血清镁离子含量是否正常试问,这批鲤鱼的血清镁离子含量是否正常由于该例中已有总体方差,因此虽然样本较小,但仍应使用由于该例中已有总体方差,因此虽然样本较小,但仍应使用 u-test 进行检验进行检验第40页,共58页,编辑于2022年,星期二该例的核心问题是希望知道:该例的核心问题是希望知道:这批鲤鱼在血清镁离子这一性状上是否正常这批鲤鱼在血清镁离子这一性状上

37、是否正常或:这批鲤鱼与正常鲤鱼在血清镁离子这一性状上是或:这批鲤鱼与正常鲤鱼在血清镁离子这一性状上是否有所区别否有所区别或:这批鲤鱼在血清镁离子这一性状上是否属于这一或:这批鲤鱼在血清镁离子这一性状上是否属于这一鲤鱼品种鲤鱼品种因此,需要知道这批鲤鱼的平均血清镁离子量与总体鲤鱼之因此,需要知道这批鲤鱼的平均血清镁离子量与总体鲤鱼之间是否有区别间是否有区别因此,应检查样本鲤鱼群的血清镁离子含量与总体鲤鱼因此,应检查样本鲤鱼群的血清镁离子含量与总体鲤鱼群之间的差异是由抽样误差所引起,还是属于真实性群之间的差异是由抽样误差所引起,还是属于真实性差异差异第41页,共58页,编辑于2022年,星期二需要

38、注意的是,样本越小,抽样就越要有代表性,否需要注意的是,样本越小,抽样就越要有代表性,否则,所得到的结论就可能发生很大的偏差则,所得到的结论就可能发生很大的偏差首先首先设立无效假设,即设设立无效假设,即设 :样本所在的总体鲤鱼:样本所在的总体鲤鱼群与原总体无差异群与原总体无差异 vs :样本所在的总体鲤鱼群:样本所在的总体鲤鱼群与原总体不是一个总体与原总体不是一个总体 即设即设该假设可以简化为该假设可以简化为其次其次在无效假设已设立的基础上,计算样本平均值,在无效假设已设立的基础上,计算样本平均值,并计算并计算 u 值值第42页,共58页,编辑于2022年,星期二当然我们也可以计算样本的标准差

39、,但这一标准差在本当然我们也可以计算样本的标准差,但这一标准差在本例中不起作用,因此可以不管它例中不起作用,因此可以不管它经计算,得:经计算,得:查附表查附表1,即标准正态分布的分布函数表,得:,即标准正态分布的分布函数表,得:u=1.49 的概率为:的概率为:这一概率值大于这一概率值大于 即:即:因此,我们应当接受无效假设,即接受因此,我们应当接受无效假设,即接受在接受无效假设的同时,就自动放弃了备择假设在接受无效假设的同时,就自动放弃了备择假设这表示这一鲤鱼样本其血清镁离子是正常的这表示这一鲤鱼样本其血清镁离子是正常的对这一结果我们可以从专业的角度进行合理的解释对这一结果我们可以从专业的角

40、度进行合理的解释第43页,共58页,编辑于2022年,星期二下面我们将这一例题系统归置一下:下面我们将这一例题系统归置一下:某品种正常成年鲤鱼每某品种正常成年鲤鱼每 100ml 血清中镁离子含量为血清中镁离子含量为今抽查某渔场今抽查某渔场 20 尾三龄鲤鱼的血清镁离子,得如下数据:尾三龄鲤鱼的血清镁离子,得如下数据:2.4 2.3 2.2 2.0 2.7 2.1 2.3 2.8 2.5 2.62.1 2.3 2.5 2.1 2.0 2.5 2.2 2.4 2.3 2.8试问,这批鲤鱼的血清镁离子含量是否正常试问,这批鲤鱼的血清镁离子含量是否正常经计算,得:经计算,得:设设查附表查附表1,u=1

41、.49 的概率为的概率为 p=0.14 0.05接受无效假设,即:这批鲤鱼的血清镁离子属正常范围接受无效假设,即:这批鲤鱼的血清镁离子属正常范围第44页,共58页,编辑于2022年,星期二该题也可以这样完成:该题也可以这样完成:设立无效假设(同前)设立无效假设(同前)计算接受区间:计算接受区间:由于由于 处于这一接受区间内,因此,应接受处于这一接受区间内,因此,应接受无效假设无效假设即:这批鲤鱼的血清镁离子在正常范围以内即:这批鲤鱼的血清镁离子在正常范围以内当接受无效假设时,就说样本平均数与已知总体平均当接受无效假设时,就说样本平均数与已知总体平均数间数间差异不显著差异不显著,如果否定了无效假

42、设而接受备择假设,如果否定了无效假设而接受备择假设时,我们就说时,我们就说差异显著差异显著,如果在,如果在 水平上否定无效水平上否定无效假设,就说假设,就说差异极显著差异极显著第45页,共58页,编辑于2022年,星期二三、一尾检验和两尾检验三、一尾检验和两尾检验从上面的例子我们可以看出,鲤鱼血清镁离子的样本从上面的例子我们可以看出,鲤鱼血清镁离子的样本平均值有可能大于总体平均值,也有可能小于总体平均值有可能大于总体平均值,也有可能小于总体平均值平均值即所得即所得 u 值可能会是负值,在左边判断是接受或否定无效假值可能会是负值,在左边判断是接受或否定无效假设设这这 u 值也有可能是正值,在右边

43、判断是接受或否定无效假值也有可能是正值,在右边判断是接受或否定无效假设设这种既要考虑左边否定区,又要考虑右边否定区,即须考虑这种既要考虑左边否定区,又要考虑右边否定区,即须考虑分布曲线两边(即两尾)的检验称为分布曲线两边(即两尾)的检验称为两尾检验两尾检验第46页,共58页,编辑于2022年,星期二这是由于事先我们并不知道所得样本平均数是否肯定大于这是由于事先我们并不知道所得样本平均数是否肯定大于总体平均值,还是肯定小于总体平均值总体平均值,还是肯定小于总体平均值在大多数情况下,一种措施有可能其效应是正向的,也在大多数情况下,一种措施有可能其效应是正向的,也有可能是负向的,即事先我们并不固定抽

44、样或试验的有可能是负向的,即事先我们并不固定抽样或试验的结果会朝向哪个方向,因此我们的备择假设只能是:结果会朝向哪个方向,因此我们的备择假设只能是:这里,既包含了这里,既包含了 ,又包含了,又包含了这种两尾检验是应用最广泛的一种检验方法这种两尾检验是应用最广泛的一种检验方法但有的时候,我们的目的非常明确,即所抽样本只可能但有的时候,我们的目的非常明确,即所抽样本只可能是大于总体平均值,或只可能是小于总体平均值是大于总体平均值,或只可能是小于总体平均值例如:某种新型药剂只可能好于常规药剂例如:某种新型药剂只可能好于常规药剂第47页,共58页,编辑于2022年,星期二某些有毒物质只能对被试动物产生

45、毒害作用,等等某些有毒物质只能对被试动物产生毒害作用,等等这一类试验的数据假设检验其备择假设只有一种情况,即这一类试验的数据假设检验其备择假设只有一种情况,即只有一个否定区间(一尾)只有一个否定区间(一尾)这样的假设检验就称为一尾检验这样的假设检验就称为一尾检验一尾检验比两尾检验更容易否定无效假设,因此应用一一尾检验比两尾检验更容易否定无效假设,因此应用一尾检验必须有非常充分的理由尾检验必须有非常充分的理由在常用的假设检验中,我们一般采用两尾检验,而对在常用的假设检验中,我们一般采用两尾检验,而对一尾检验应谨慎使用一尾检验应谨慎使用第48页,共58页,编辑于2022年,星期二两尾检验和一尾检验

46、的比较:两尾检验和一尾检验的比较:第49页,共58页,编辑于2022年,星期二四、假设检验的两类错误四、假设检验的两类错误在假设检验中,接受或否定无效假设的理论依据是在假设检验中,接受或否定无效假设的理论依据是小概率小概率事件的实际不可能性原理事件的实际不可能性原理因此,所得结论并不是百分之百的正确的因此,所得结论并不是百分之百的正确的事实上,统计假设检验有可能犯两类事实上,统计假设检验有可能犯两类错误错误:如果如果 是正确的,即是正确的,即 为真,但检验的结论由于为真,但检验的结论由于差异显著差异显著而被我们否定掉了(此时,我们须冒而被我们否定掉了(此时,我们须冒5%下错下错结论的风险),或

47、由于结论的风险),或由于差异极显著差异极显著而被我们否定掉了而被我们否定掉了(须冒(须冒1%下错结论的风险),因而犯了错,这一类下错结论的风险),因而犯了错,这一类错误就称为错误就称为型型错误,或称错误,或称 型型错误,错误,犯犯型错误的型错误的概率不超过概率不超过显著水平显著水平 值值 第50页,共58页,编辑于2022年,星期二犯犯型错误的实质就是把型错误的实质就是把非真实性差异非真实性差异错判为错判为真实性差真实性差异异,即,即弃真弃真如果无效假设如果无效假设 是错误的,即是错误的,即 为假,检验结果却为假,检验结果却发现发现差异不显著差异不显著而被接受,同时摒弃了正确的备择假而被接受,

48、同时摒弃了正确的备择假设设 在统计学中,所谓的在统计学中,所谓的差异不显著差异不显著,其真实含义是,其真实含义是没有没有充分的理由否定充分的理由否定 ,但也没有理由接受但也没有理由接受 但我们所执行的是非此即彼原则,因此,既然差异不显著,但我们所执行的是非此即彼原则,因此,既然差异不显著,就必须接受就必须接受 这一类错误称为这一类错误称为型错误,或称为型错误,或称为 型错误,型错误,型错误的型错误的概率用概率用 表示表示第51页,共58页,编辑于2022年,星期二这里的差异不显著,有两种含义:这里的差异不显著,有两种含义:一是样本所在总体与已知总体间的确没有差异,样本平均一是样本所在总体与已知

49、总体间的确没有差异,样本平均值与已知总体平均值间的差异纯属值与已知总体平均值间的差异纯属抽样误差抽样误差二是样本所在总体与已知总体间有差异,但由于二是样本所在总体与已知总体间有差异,但由于试验误试验误差大差大而掩盖掉了这种差异而掩盖掉了这种差异型错误就是把型错误就是把真实性差异真实性差异错判为错判为非真实性差异非真实性差异,即虽,即虽然然 是是假假的,但通过检验却被的,但通过检验却被接受接受了,同时摒了,同时摒弃了真的弃了真的 ,这称为,这称为存伪存伪第52页,共58页,编辑于2022年,星期二不同不同 时的时的 值值第53页,共58页,编辑于2022年,星期二在统计推断中,我们作出一个判断,

50、有两个方向的错误可能在统计推断中,我们作出一个判断,有两个方向的错误可能存在,这说明我们不能绝对地肯定,也不应绝对地否定某存在,这说明我们不能绝对地肯定,也不应绝对地否定某一假设一假设因此,有一定的把握,但也有一定的犯错率,这就是统计因此,有一定的把握,但也有一定的犯错率,这就是统计推断的特点、统计学的概率性特征推断的特点、统计学的概率性特征下面我们用表的形式来说明两类错误与假设的关系下面我们用表的形式来说明两类错误与假设的关系 接受接受 否定否定无效假设是正确的(无效假设是正确的(为真)为真)(弃真)(弃真)无效假设是错误的(无效假设是错误的(为假)为假)(存伪)(存伪)第54页,共58页,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁