《第三章假设检验(二)课件.ppt》由会员分享,可在线阅读,更多相关《第三章假设检验(二)课件.ppt(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、食品试验设计Experiment Design of Food Research主讲:曹文红Speeches:Cao Wenhong广东海洋大学食品科技学院College of Food Science&Technology,GDOU 统计假设检验主要讲授内容:1、统计假设检验的意义及基本原理2、统计假设检验的方法与步骤3、统计假设检验的几何意义与两类错误4、样本平均数的假设检验5、二项百分率的假设检验6、统计假设检验应注意的问题7、参数的区间估计序言许多科学研究都是从建立假说开始的。许多科学研究都是从建立假说开始的。天文学史天文学史上的日心说、宇宙发生史上的大爆炸说、地球形上的日心说、宇宙发
2、生史上的大爆炸说、地球形成史上的冷凝说、大陆形成史上的板块漂移说等,成史上的冷凝说、大陆形成史上的板块漂移说等,都是一些假说。假说是人们依据已获得的部分信都是一些假说。假说是人们依据已获得的部分信息对客观世界的某种性状作出的推断性描述。假息对客观世界的某种性状作出的推断性描述。假说既可能属真,也可以有误。假说在被提出之后,说既可能属真,也可以有误。假说在被提出之后,人们又进一步搜集信息,对假说的正确性进行验人们又进一步搜集信息,对假说的正确性进行验证。经过验证,或推翻假说或支持假说,真理就证。经过验证,或推翻假说或支持假说,真理就在这一过程中不断地被揭示、被发展,谬误也在在这一过程中不断地被揭
3、示、被发展,谬误也在这一过程中不断地被推翻、被纠正。统计假设检这一过程中不断地被推翻、被纠正。统计假设检验的过程类似于这一证实或推翻假说、从而获取验的过程类似于这一证实或推翻假说、从而获取真理的过程。真理的过程。科学研究的目的是获得总体的信息。而我们只能以来自总体的样本作为试验对象,在试验研究中,所获得的资料通常都是样本的结果,而我们希望了解的却是样本所在总体的情况。因此,还须从由样本到总体的方向来研究样本与总体的关系,即进行统计推断。所谓统计推断,就是根据抽样分布规律与概率理论,由样本结果去推论总体特征。主要包括假设检验和参数估计。概括起来说,统计假设检验就是一种带有概率值保证的反证法。反证
4、法是大家熟悉的一种逻辑推理证明方法。有些命题从正面进行推论难以证明,但证明它的否命题却往往事半功倍,这就是反证法的思想方法。这样做的理由是从逻辑上说,否命题不成立,则其原命题就自然成立。反证法在数学证明中应用比较多。反证法的逻辑就是:证明了作为否命题的假设的错误,那么原命题就自然正确了。统计假设检验从逻辑过程看也是一种反证法。统计检验人员常常希望证明备择假设是正确的,但他却不直接证明备择假设的正确性,而是从与备择假设对立的虚无假设出发,以虚无假设为条件,采集样本数据,确定抽样分布,计算检验统计量,考察检验计量取值的概率,如果最终发现这是一个小概率事件,那就要根据小概率事件原理推翻原虚无假设。当
5、然,研究者必须保证在整个过程中除所作虚无假设之外的一切工作都是严密、科学的。虚无假设与备择假设是一对互否命题,也就是我们前面所说的他们是非此即彼的,推翻了虚无假设,备择假设就自然成立了。这就是统计假设检验应用反证法的“反证”过程。所谓带有概率值保证是指上述的用反证的方法作的统计假设检验,最终推翻虚无假设也即由于所求检验统计量的取值为一小概率事件,而根据小概率事件原理推翻虚无假设。我们知道,根据小概率事件原理作决策判断是一种科学的正确的决策思想方法,但并不保证每次的决策都是正确。换句话说,这一推翻虚无假设的决策也是可能犯错误的,只是犯错误的概率比较小而决策正确的概率比较大,而且这个决策正确的概率
6、是由我们控制,是可以计算的。这就是统计假设检验“带有概率值保证”的含义。一、统计假设检验概述1 1、统计假设检验的意义与基本原理、统计假设检验的意义与基本原理1.1、统计假设检验的意义例:老工艺0=48.2%新工艺 =52.5%这个差异到底是由什么造成的?采用新工艺?Or由抽样误差造成的?Or由这两个部分共同造成的?叫做表面效应 统计学认为,仅由表面效应下结论是不正确的。因为我们不知道采用新工艺之后的总体平均数是否高于原总体平均数0。处理效应试验误差统计假设检验正是这样一种运用抽样分布规律和概率理论,由从试验样本获得的表面效应去推断试验的处理效应是否真实存在的统计方法。处理效应试验误差1.2
7、统计假设检验的基本原理I I、对研究的总体提出假设:、对研究的总体提出假设:H H0 0:=0 0(无效假设)(无效假设)H HA A:0 0 (备择假设)(备择假设)IIII、在、在H H0 0成立的条件下,构造合适的统计量,并由该统成立的条件下,构造合适的统计量,并由该统计量的抽样分布计算样本统计量的概率。计量的抽样分布计算样本统计量的概率。=0 0,所以表面效应所以表面效应 仅由误差造成,处仅由误差造成,处理效应不存在。理效应不存在。可以看成是从 总体中随机抽取的一个样本平均数服从对其标准化,使之服从标准正态分布III、根据估计出的统计量的概率的大小,作出接受或者否定无效假设的判断。根据
8、统计量的概率与显著性水平大小的关系作出接受或者否定无效假设的判断。=0.05、=0.011.3 1.3 统计假设检验的步骤统计假设检验的步骤(1)建立假设。(2)确定显著性水平。(3)检验计算统计量。构造一个统计量使 它服从标准正态分布或者是t分布。(4)统计推断。1.4 1.4 统计假设检验的几何意义与两类错误统计假设检验的几何意义与两类错误I、几何意义在统计假设检验中,要在显著水平在统计假设检验中,要在显著水平否定否定H H0 0,必须必须|u|u|u|u,亦即亦即uu-u-u,uuu u。也就是也就是H0:=0 被否定 ,这个区域叫否定域。H0:=0 被肯定,这个区域叫肯定域。统计假设检
9、验是根据小概率事件的不可能性原理来决定否定或肯定无效假设的。第一类错误:H0本身正确,但是通过假设检验却否定了它,也就是将非真实差异错判为真实差异.又叫错误。第二类错误:H0本身错误,但是通过假设检验却接受了它,也就是将真实差异错判为非真实差异.又叫错误。II、统计假设检验的两类错误两类错误示意图减小第一类错误:缩小。减小第二类错误:减小均数标准误两尾检验与一尾检验二、样本平均数的假设检验1 1、单个样本平均数的假设检验、单个样本平均数的假设检验检验某一样本平均数 与一已知总体平均数 是否有差异的方法,即I、u检验法条件:样本资料服从正态分布条件:样本资料服从正态分布N N(,2 2),且总)
10、,且总体方差体方差2 2已知。已知。2 2未知,但样本平均数未知,但样本平均数 来自一个大样本。来自一个大样本。例:书上例:书上例:习题8II、t检验例:习题7(1 1)建立假设)建立假设 H H0 0:=0 0(新工艺提取胡萝卜素与传统工艺无差异)(新工艺提取胡萝卜素与传统工艺无差异)H HA A:0 0 (新工艺与旧工艺有差异)(新工艺与旧工艺有差异)(2 2)确定显著性水平)确定显著性水平 =0.05=0.05(双尾检验)(双尾检验)利用t分布来进行统计量的概率计算的假设检验方法。(3 3)检验计算)检验计算自由度df=8-1=7统计量t值:(4)统计推断 查附表3 t0.05(7)=2
11、.365 而|t|=1.6160.05 故应接受H0 说明新旧工艺的-胡萝卜素的提取率无显差异。2、两个样本平均数的假设检验两个样本平均数的假设检验,就是由两个样本平均两个样本平均数的假设检验,就是由两个样本平均数之差数之差 去推断两个样本所在总体平均数去推断两个样本所在总体平均数1 1、2 2 是否有差异,也就是检验无效假设是否有差异,也就是检验无效假设和备择假设的问题。I、成组资料平均数的假设检验一个试验中若有两个处理,可将试验的全部单元一个试验中若有两个处理,可将试验的全部单元完全随机地分成两组,各组的单元数可以相等也完全随机地分成两组,各组的单元数可以相等也可以不相等。然后再对两组各自
12、地实施一处理。可以不相等。然后再对两组各自地实施一处理。由这样的实验中每个单元测得的一个观察值所组由这样的实验中每个单元测得的一个观察值所组成的资料即为成组资料。成的资料即为成组资料。(1 1)u u检验检验如果两个样本所在的总体为正态分布,且总体方差如果两个样本所在的总体为正态分布,且总体方差已知;或者总体方差未知,但两个样本都是大样本已知;或者总体方差未知,但两个样本都是大样本(n n1 1、n n2 23030),可采用可采用u u检验。检验。在 下,正态离差u值为:如果总体方差未知,但n1n1、n230n230,可由样本方,可由样本方差差S S1 12 2、S S2 22 2估计总体方
13、差估计总体方差1 12 2、2 22 2。例:书上P78服从具有自由度服从具有自由度df=ndf=n1 1+n+n2 2-2-2的的t t分布,在分布,在H H0 0:1 1=2 2 的条件之下,的条件之下,(2 2)t t检验检验当两个样本所在的总体方差当两个样本所在的总体方差 1 12 2、2 22 2,又是小样本,又是小样本的时候,有的时候,有其中:例:书上P80II、成对资料平均数的假设检验若试验设计是将条件、性质相同或相近的两个供若试验设计是将条件、性质相同或相近的两个供试单元成一对,然后对每一配对的两个供试单元试单元成一对,然后对每一配对的两个供试单元分别随机的给以不同的处理。从这
14、种配对试验获分别随机的给以不同的处理。从这种配对试验获得的数据叫做成对资料。成对资料中两个处理的得的数据叫做成对资料。成对资料中两个处理的数据不是相互独立的,而是存在着某种联系。数据不是相互独立的,而是存在着某种联系。差数标准差为差数平均数为差数均数标准误为服从自由度为df=n-1的t分布在H0:1=2 的条件之下,d=0自由度为n-1,根据该值取值概率的大小进行成对资料平均数的假设检验。例:某减肥保健食品进行检验减肥的效果 三、二项百分率的假设检验在食品科学研究或生产实践中,有许多年试验结果都是用百分率来表示的。这些百分率都是由计数一个来自二项总体的样本中某一属性个体数目而求得的,即p=x/
15、n。它实际上是由二项次数x转换成的百分率,其总体服从二项分布,所以叫二项百分率。对二项百分率的假设检验,从理论上讲,应按二项分布进行,即由二项式(q+p)n的展开式中与样本百分率P对应项求出百分率的概率,再将此概率与显著性水平进行比较,从而做出统计推断。但是计算非常麻烦。当样本容量较大,P不过小,np和nq都不小于5时,二项分布接近于正态分布。因此,可以将二项百分率资料作正态处理,从而进行近似的u检验。I、单个样本百分率的假设检验在n30,np,nq 5时,有标准化后,在在H H0 0:p=pp=p0 0下下其中其中对对u u进行假设检验进行假设检验例:习题12 p101II、两个样本百分率的
16、假设检验由两个样本百分率 和 的差异去推断它们所在总体百分率P1和P2是否存在差异的方法。在两个样本容量n1和n2均较大(3030)n n1 1p p1 1,n n1 1q q1 1,n n2 2p p2 2,n n2 2q q2 2都大于都大于5 5时,两个样本百分率的差数时,两个样本百分率的差数 服从正态分布。服从正态分布。在 下,则其中:在 下由样本获得的两样本百分率的差数标准误差III、二项百分率假设检验的连续性矫正样本容量比较小,在n25,np5的时候必需进行连续性矫正。四、统计假设检验中应注意的问题1、要有严密的试验设计和正确的试验技术2、选用的统计假设检验方法应符合其应用条件3、要正确理解差异显著性的统计意义4、合理建立假设,正确计算检验的统计量5、结论不能绝对化五、参数的区间估计总体平均数区间估计总体平均数区间估计两个总体平均数差数的区间估计二项总体百分率p的区间估计两个总体百分率差数的区间估计The end!