《第四章显著性检验优秀课件.ppt》由会员分享,可在线阅读,更多相关《第四章显著性检验优秀课件.ppt(119页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章显著性检验第1页,本讲稿共119页 显著性检验显著性检验又叫又叫假设检验假设检验是统计学中是统计学中的一个重要内容的一个重要内容。显著性检验的方法很多显著性检验的方法很多,常用的有,常用的有u检验、检验、t检验、检验、F检验和检验和 2检验等。尽管这检验等。尽管这些检验方法的使用条件及用途不同,但检些检验方法的使用条件及用途不同,但检验的基本原理是相同的。验的基本原理是相同的。下一张下一张 主主 页页 退退 出出 上一张上一张 第2页,本讲稿共119页第一节第一节 显著性检验的显著性检验的基本原理基本原理 下一张下一张 主主 页页 退退 出出 上一张上一张 一、显著性检验的意义一、显著性
2、检验的意义第3页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 如,某地进行了两个水稻品种对比试验,如,某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植在相同条件下,两个水稻品种分别种植10个个小区,获得两个水稻品种的平均产量为小区,获得两个水稻品种的平均产量为:我们能否根据我们能否根据 就判定这两个水就判定这两个水稻品种平均产量不同?结论是,不一定。稻品种平均产量不同?结论是,不一定。第4页,本讲稿共119页因为两个水稻品种平均产量因为两个水稻品种平均产量 、都、都是从试验种植的是从试验种植的10个小区获得,仅是两个品个小区获得,仅是两个品种有关总体平
3、均数种有关总体平均数 的估计值。由于存的估计值。由于存在试验误差在试验误差,样本平均数并不等于总体平均,样本平均数并不等于总体平均数数,样本平均数包含总体平均数与试验误差样本平均数包含总体平均数与试验误差二部分二部分,即,即下一张下一张 主主 页页 退退 出出 上一张上一张 第5页,本讲稿共119页 于是,于是,下一张下一张 主主 页页 退退 出出 上一张上一张 其中,其中,为为试验的表面差异试验的表面差异,为为试验的真实差异试验的真实差异,为为试验误差试验误差。第6页,本讲稿共119页表明,试验的表面差异表明,试验的表面差异 是由两部分组是由两部分组成:成:一部分是一部分是试验的真实差异试验
4、的真实差异 ;另一部分是另一部分是试验误差试验误差 。虽然真实差异虽然真实差异 未知,但试验的表面未知,但试验的表面差异差异 是可以计算的,借助数理统计方法可是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,以对试验误差作出估计。所以,可将试验的表面可将试验的表面差异差异 与试验误差相比较间接推断真实差与试验误差相比较间接推断真实差异异 是否存在是否存在,即进行差异显著性检验。,即进行差异显著性检验。下一张下一张 主主 页页 退退 出出 上一张上一张 第7页,本讲稿共119页显著性检验的目的在于判明,试验的表面显著性检验的目的在于判明,试验的表面差异差异 主要是由试验的真实差异主要是
5、由试验的真实差异 造成的,还是由试验误差造成的,还是由试验误差 造成的,从造成的,从而得到可靠的结论。而得到可靠的结论。下一张下一张 主主 页页 退退 出出 上一张上一张 第8页,本讲稿共119页二、显著性检验的步骤二、显著性检验的步骤下一张下一张 主主 页页 退退 出出 上一张上一张【例【例41】已知某品种玉米单穗重已知某品种玉米单穗重N(300,9.52),即单穗重总体平均数),即单穗重总体平均数300g,标准差,标准差9.5g。在种植过程中喷。在种植过程中喷洒了某种药剂的植株中随机抽取洒了某种药剂的植株中随机抽取9个果穗个果穗 ,测,测得平均单穗重得平均单穗重 308g,试问这种药剂对,
6、试问这种药剂对该品种玉米的平均单穗重有无真实影响?该品种玉米的平均单穗重有无真实影响?第9页,本讲稿共119页 (一)提出假设(一)提出假设 下一张下一张 主主 页页 退退 出出 上一张上一张 首先对样本所在的总体作一个假设。假首先对样本所在的总体作一个假设。假设喷洒了药剂的玉米单穗重总体平均数设喷洒了药剂的玉米单穗重总体平均数与原来的玉米单穗重总体平均数之间没与原来的玉米单穗重总体平均数之间没有真实差异,即或。也就是有真实差异,即或。也就是假设表面差异假设表面差异 是由抽样误差造成是由抽样误差造成的。的。第10页,本讲稿共119页这种假设通常称为这种假设通常称为无效假设无效假设或或零假设零假
7、设,记,记为为 。无效假设是待检验的假设,它。无效假设是待检验的假设,它有可能被接受,也有可能被否定。有可能被接受,也有可能被否定。相应地还要有一个对应假设,相应地还要有一个对应假设,称为称为备择假备择假设设。备择假设是在无效假设被否定时。备择假设是在无效假设被否定时,准备接,准备接受的假设,记为受的假设,记为 或或 。通过检验,若否定无效假设,我们就接受备通过检验,若否定无效假设,我们就接受备择假设。择假设。下一张下一张 主主 页页 退退 出出 上一张上一张 第11页,本讲稿共119页 (二)计算概率(二)计算概率 下一张下一张 主主 页页 退退 出出 上一张上一张 在假定无效假设成立的前提
8、下,根据所在假定无效假设成立的前提下,根据所检验的统计数的抽样分布检验的统计数的抽样分布 ,计算表面差异,计算表面差异 是由抽样误差造成的概率。是由抽样误差造成的概率。本例是在假定无效假设本例是在假定无效假设 成立成立的前提下,研究在的前提下,研究在 N(300,9.52)这)这一已知正态总体中抽样所获得的样本平均数一已知正态总体中抽样所获得的样本平均数 的分布。的分布。第12页,本讲稿共119页 第三章已述及,若第三章已述及,若 ,则样本平均数,则样本平均数 ,将其标准化,得,将其标准化,得下一张下一张 主主 页页 退退 出出 上一张上一张 本例,本例,得得第13页,本讲稿共119页下面估计
9、下面估计|u|2.526的两尾概率,即估的两尾概率,即估计计P(|u|2.526)是多少?)是多少?我们知道,两尾概率为我们知道,两尾概率为0.05的临界值为的临界值为 =1.96,两尾概率为,两尾概率为0.01的临界的临界 值值为为 =2.58,即:,即:下一张下一张 主主 页页 退退 出出 上一张上一张 P(|1.96)=P(1.96)+P(-1.96)=0.05 u第14页,本讲稿共119页 P(|2.58)=P(2.58)+P(-2.58)=0.01下一张下一张 主主 页页 退退 出出 上一张上一张 根据样本数据计算所得的根据样本数据计算所得的 值为值为2.526,介于两个临界介于两个
10、临界 值之间,即:值之间,即:2.526第15页,本讲稿共119页所以,所以,|2.526的概率的概率P介于介于0.01和和0.05之间,即之间,即 0.01 p 0.05 说明假定表面差异(说明假定表面差异()是由抽样)是由抽样误差造成的概率在误差造成的概率在0.010.05之间之间。下一张下一张 主主 页页 退退 出出 上一张上一张 第16页,本讲稿共119页 (三三)统计推断统计推断 下一张下一张 主主 页页 退退 出出 上一张上一张 根据小概率事件实际不可能性原理作出根据小概率事件实际不可能性原理作出否定或接受无效假设的推断。否定或接受无效假设的推断。第17页,本讲稿共119页 根据这
11、一原理根据这一原理 ,当表面差异是抽样误差,当表面差异是抽样误差的概率小于的概率小于0.05时时,可以认为在一次抽样中,可以认为在一次抽样中表面差异是抽样误差实际上是不可能的,因而表面差异是抽样误差实际上是不可能的,因而否定原先所作的无效假设否定原先所作的无效假设H0:,接受,接受备择假设备择假设HA:,即认为存在真实差即认为存在真实差异。异。当表面差异是抽样误差的概率大于当表面差异是抽样误差的概率大于0.05时,说明无效假设时,说明无效假设H0:成立的可能成立的可能性大,不能被否定,因而也就不能接受备择假性大,不能被否定,因而也就不能接受备择假设设HA:。下一张下一张 主主 页页 退退 出出
12、 上一张上一张 第18页,本讲稿共119页显著性检验的结果表明:显著性检验的结果表明:本例的样本平均数与原总体平均数之间本例的样本平均数与原总体平均数之间的的表面差异表面差异()除包含抽样误差除包含抽样误差外,还外,还包含真实差异包含真实差异(),即喷洒即喷洒了药剂的玉米单穗重总体平均数了药剂的玉米单穗重总体平均数 与原来与原来的玉米单穗重总体平均数的玉米单穗重总体平均数 不同。不同。下一张下一张 主主 页页 退退 出出 上一张上一张 第19页,本讲稿共119页 综上所述,显著性检验,从提出无效假设综上所述,显著性检验,从提出无效假设与备择假设,到根据小概率事件实际不可能性原与备择假设,到根据
13、小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应理来否定或接受无效假设,这一过程实际上是应用所谓用所谓“概率性质的反证法概率性质的反证法”对样本所属总体所对样本所属总体所作的无效假设的统计推断。作的无效假设的统计推断。下一张下一张 主主 页页 退退 出出 上一张上一张 上述显著性检验利用了上述显著性检验利用了 分布来估计出分布来估计出 u 2.526的两尾概率,所以的两尾概率,所以称为称为 检验检验.第20页,本讲稿共119页三、显著水平与两种类型的错误三、显著水平与两种类型的错误 (一一)显著水平显著水平 下一张下一张 主主 页页 退退 出出 上一张上一张 用来否定或接受无
14、效假设的概率标准叫用来否定或接受无效假设的概率标准叫显著水平显著水平,记作。,记作。在生物学研究中常取在生物学研究中常取=0.05,称,称 为为 5%显显 著著 水水 平;平;或或=0.01,称,称 为为 1%显显 著著 水水 平平 或或 极极显著水平。显著水平。第21页,本讲稿共119页对于上述例子的检验来说,若对于上述例子的检验来说,若 u 1.96,则说明试验的表面差异属于试验误差,则说明试验的表面差异属于试验误差的概率的概率p0.05,即表面差异属于试验误差的,即表面差异属于试验误差的可能性大,不能否定。统计学上把可能性大,不能否定。统计学上把这一检验结果表述为:这一检验结果表述为:“
15、总体平均数总体平均数 与与差异不显著差异不显著”,在计算所得的,在计算所得的 u 值的右上方值的右上方标记标记“”或不标记符号;或不标记符号;下一张下一张 主主 页页 退退 出出 上一张上一张 第22页,本讲稿共119页若若|,则说明试验的,则说明试验的表面差异属于试验误差的概率表面差异属于试验误差的概率p在在0.010.05之间,即之间,即0.01p0.05,表面差,表面差异异 属属 于于 试试 验误差的可能性较小,应否定验误差的可能性较小,应否定H0:,接受:,接受HA:。统计学上:。统计学上把这一检验结果表述为:把这一检验结果表述为:“总体平均数总体平均数与与 差异显著差异显著”,在计算
16、所得的值的右,在计算所得的值的右上方标记上方标记“*”;下一张下一张 主主 页页 退退 出出 上一张上一张 第23页,本讲稿共119页若若|2.58,则说明试验的表面差异,则说明试验的表面差异属于试验误差的概率属于试验误差的概率 p 不超过不超过 0.01,即,即 p 0.01,表面差异属于试验误差的可能性更,表面差异属于试验误差的可能性更小,应否定小,应否定HH0 0:,接受,接受HHAA:。统。统计学上把这一检验结果表述为:计学上把这一检验结果表述为:“总体平均总体平均数与数与差异极显著差异极显著 ”,在计算所得的在计算所得的 值的右上方标记值的右上方标记“*”。下一张下一张 主主 页页
17、退退 出出 上一张上一张 第24页,本讲稿共119页可以看到,是否否定无效可以看到,是否否定无效假设假设假设假设 ,是,是用实际计算出的检验统计数的绝对值与显著水用实际计算出的检验统计数的绝对值与显著水平对应的临界值比较:平对应的临界值比较:若若|,则在,则在 水平上否定水平上否定 若若|,则,则 不不 能能 在在 水水 平平 上上 否否定定 。下一张下一张 主主 页页 退退 出出 上一张上一张 第25页,本讲稿共119页 下一张下一张 主主 页页 退退 出出 上一张上一张 区间区间 和和 称为水称为水平平 上的上的否定域否定域,而区间,而区间 则则称为称为 水平上的水平上的接受域接受域。第2
18、6页,本讲稿共119页因为在显著性检验中,否定或接受无因为在显著性检验中,否定或接受无效假设的依据是效假设的依据是“小概率事件实际不可能小概率事件实际不可能性原理性原理”,所以我们下的结论不可能有百,所以我们下的结论不可能有百分之百的把握。分之百的把握。下一张下一张 主主 页页 退退 出出 上一张上一张(二二)两类错误两类错误 第27页,本讲稿共119页例如,经检例如,经检 验获得验获得“差异显著差异显著”的结论,的结论,我们有我们有95%的把握否定无效假设的把握否定无效假设H0,同时要,同时要冒冒5%下错结论的风险;下错结论的风险;经经 检验获得检验获得“差差异极显著异极显著”的结论,我们有
19、的结论,我们有99%的把握否定的把握否定无效假设无效假设H0,同时要冒,同时要冒1%下错结论的风险;下错结论的风险;而经而经 检验获得检验获得“差异不显著差异不显著”的结论,在统计学的结论,在统计学上是指上是指“没有理由没有理由”否定无效假设否定无效假设H0,同样也,同样也要冒下错结论的风险。要冒下错结论的风险。下一张下一张 主主 页页 退退 出出 上一张上一张 第28页,本讲稿共119页 显著性检验可能出现两种类型的错误:显著性检验可能出现两种类型的错误:下一张下一张 主主 页页 退退 出出 上一张上一张 型错误型错误 与与型错误。型错误。型错误又称为错误,就是把非真实型错误又称为错误,就是
20、把非真实的差异错判为是真实的差异,即实际上的差异错判为是真实的差异,即实际上H0正正确,检验结果为否定确,检验结果为否定H0。犯犯类型错误的可类型错误的可能性一般不会超过所选用的显著水平;能性一般不会超过所选用的显著水平;第29页,本讲稿共119页型错误又称为错误型错误又称为错误,就是把真实的,就是把真实的差异错判为是非真实的差异差异错判为是非真实的差异,即实际上,即实际上HA正确,检验结果却未能否定正确,检验结果却未能否定H0。犯犯类型类型错误的可能性记为错误的可能性记为,一般是随着的,一般是随着的减小或试验误差的增大而增大,所以减小或试验误差的增大而增大,所以越小或试验误差越大,就越容易将
21、试验的真越小或试验误差越大,就越容易将试验的真实差异错判为试验误差。实差异错判为试验误差。下一张下一张 主主 页页 退退 出出 上一张上一张 第30页,本讲稿共119页 显著性检验的两类错误归纳如下:显著性检验的两类错误归纳如下:下一张下一张 主主 页页 退退 出出 上一张上一张 表表4-1 显著性检验的两类错误显著性检验的两类错误第31页,本讲稿共119页 因此,如果经因此,如果经 检验获得检验获得“差异显著差异显著”或或“差异极显著差异极显著”,我们有,我们有95%或或99%的把的把握认为,握认为,与与 不相同,不相同,判断错误的可能性判断错误的可能性不超过不超过5%或或1%;若经若经 检
22、验获得检验获得“差差异不显著异不显著”,我们只能认为在本次试验条件下,我们只能认为在本次试验条件下,与与 没有差异的假设没有差异的假设 H0:未被否定未被否定,这,这有两种可能存在:有两种可能存在:或者是或者是 与与 确实没有差确实没有差异,异,或者是或者是 与与 有差异而因为试验误差大有差异而因为试验误差大被掩盖了被掩盖了。下一张下一张 主主 页页 退退 出出 上一张上一张 第32页,本讲稿共119页因而,不能仅凭统计推断就简单地因而,不能仅凭统计推断就简单地作出绝对肯定或绝对否定的结论。作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错有很大的可靠性,但有一定的错误率误率”这是统
23、计推断的基本特点。这是统计推断的基本特点。下一张下一张 主主 页页 退退 出出 上一张上一张 第33页,本讲稿共119页 为了降低犯两类错误的概率,一般从为了降低犯两类错误的概率,一般从选取选取适当的显著水平适当的显著水平和和增加试验重复次数增加试验重复次数来考来考虑。因为选取数值小的显著水平值可以降低虑。因为选取数值小的显著水平值可以降低犯犯类型错误的概率,但与此同时也增大了犯类型错误的概率,但与此同时也增大了犯型错误的概率,所以显著水平值的选用要型错误的概率,所以显著水平值的选用要同时考虑到犯两类错误的概率的大小。同时考虑到犯两类错误的概率的大小。下一张下一张 主主 页页 退退 出出 上一
24、张上一张 第34页,本讲稿共119页 对于田间试验,由于试验条件不容易控制完全对于田间试验,由于试验条件不容易控制完全对于田间试验,由于试验条件不容易控制完全对于田间试验,由于试验条件不容易控制完全一致,试验误差较大,一致,试验误差较大,一致,试验误差较大,一致,试验误差较大,为了降低犯为了降低犯为了降低犯为了降低犯型错误的概型错误的概率,也有选取显著水平为率,也有选取显著水平为0.10或或或或0.20的的(注意,在选用这些显著水平值时,一定要予(注意,在选用这些显著水平值时,一定要予以注明)。以注明)。通常采用通常采用适当增加试验处理的重复适当增加试验处理的重复次数次数(即样本容量),(即样
25、本容量),以降低试验误差,提高以降低试验误差,提高试验的精确度,试验的精确度,降低犯降低犯型错误的概率。型错误的概率。型错误的概率。型错误的概率。下一张下一张 主主 页页 退退 出出 上一张上一张 第35页,本讲稿共119页 在【例在【例41】中,对应于无效假设】中,对应于无效假设 H0:的备择假设为的备择假设为HA:。:。HA实际实际上包含了或这两种情况。此时,上包含了或这两种情况。此时,在水平上否定域为和,对在水平上否定域为和,对称地分配在分布曲线的两侧尾部,每侧尾部称地分配在分布曲线的两侧尾部,每侧尾部的概率为的概率为 ,如,如图图4-1所示。这种所示。这种利用两利用两尾概率进行的检验叫
26、两尾检验尾概率进行的检验叫两尾检验.为为 水平水平两尾检验的临界值。两尾检验的临界值。四、两尾检验与一尾检验四、两尾检验与一尾检验下一张下一张 主主 页页 退退 出出 上一张上一张 第36页,本讲稿共119页两尾检验的目的在于判断两尾检验的目的在于判断 与与 有无差有无差异,而不考虑异,而不考虑 与与 谁大谁小。谁大谁小。下一张下一张 主主 页页 退退 出出 上一张上一张 在有些情况下两尾检验不一定符合实际情在有些情况下两尾检验不一定符合实际情况。况。第37页,本讲稿共119页例如,目前我国大豆育种工作者认为,大例如,目前我国大豆育种工作者认为,大豆籽粒蛋白质含量超过豆籽粒蛋白质含量超过45%
27、()的品种为高)的品种为高蛋白品种。如果进行样品含量检测蛋白品种。如果进行样品含量检测 ,我们关心,我们关心的是的是 所在的总体平均数所在的总体平均数 大于大于 。此时的无效假设仍为此时的无效假设仍为H0:,但备择,但备择假设则为假设则为HA:。这时否定域位于。这时否定域位于 分布分布曲线的右尾,即曲线的右尾,即 。例如当例如当 =0.05时,否定域为时,否定域为 。下一张下一张 主主 页页 退退 出出 上一张上一张 第38页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 又如,国家规定稻米中某种农药成分的残又如,国家规定稻米中某种农药成分的残留物含量应低于留物含量应低于
28、0.1%()。在抽检中,我)。在抽检中,我们关心的是们关心的是 所在的总体平均数所在的总体平均数 小于小于 (即(即该品种属于合格产品)。此时的无效假设仍为该品种属于合格产品)。此时的无效假设仍为H0:,但备择假设则为,但备择假设则为HA:。这这 时时 否否 定定 域域 位位 于于 分分 布布 曲曲 线线 的的 左尾,左尾,即即 。例如当。例如当 =0.05时,时,分布的分布的否定域为否定域为 ,见,见图图4-2。第39页,本讲稿共119页一尾检验的一尾检验的 =两尾检验的两尾检验的 =2.33 =2.33。这种这种利用一尾概率进行的检验叫一尾检验利用一尾概率进行的检验叫一尾检验。此时。此时
29、为一尾检验的临界为一尾检验的临界 值。值。一尾检验的一尾检验的 =两尾检验的两尾检验的 下一张下一张 主主 页页 退退 出出 上一张上一张 例如,例如,一尾检验的一尾检验的=两尾检验的两尾检验的 =1.64=1.64,第40页,本讲稿共119页实际应用中,如何选用两尾检验或一尾检实际应用中,如何选用两尾检验或一尾检验,应根据专业的要求在试验设计时就确定。验,应根据专业的要求在试验设计时就确定。一般情况下,若事先不知道与谁大谁一般情况下,若事先不知道与谁大谁小,只是为了检验与小,只是为了检验与 是否存在差异,则选是否存在差异,则选用两尾检验;用两尾检验;如果凭借一定的专业知识和经验如果凭借一定的
30、专业知识和经验推测推测 应小于(或大于)时,则选用一尾检应小于(或大于)时,则选用一尾检验。验。下一张下一张 主主 页页 退退 出出 上一张上一张 第41页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 第二节第二节 样本平均数与总体样本平均数与总体 平均数差异显著性检验平均数差异显著性检验 检验一个样本平均数与已知的总体检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本平均数是否有显著差异,即检验该样本是否来自某一总体。已知的总体平均数是否来自某一总体。已知的总体平均数一般为一些公认的理论数值、经验数值或一般为一些公认的理论数值、经验数值或期望数值。期望数
31、值。第42页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 如果总体如果总体 未知、且为小样本(未知、且为小样本(n 30),则用),则用t t检验法检验法。t t 检验法,就是在显著性检验时利用检验法,就是在显著性检验时利用 t t分布进行概率计算的检验方法分布进行概率计算的检验方法。第43页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 【例【例4343】晚稻良种汕优晚稻良种汕优63的千粒重的千粒重 27.5g。现育成一高产品种协优辐现育成一高产品种协优辐819,在在9个小区种植,得其千粒重为:个小区种植,得其千粒重为:32.5、28.6、28.
32、4、24.7、29.1、27.2、29.8、33.3、29.7(g)问新育成品种的千粒重与汕优问新育成品种的千粒重与汕优6363有无显著有无显著差异?差异?第44页,本讲稿共119页 下一张下一张 主主 页页 退退 出出 上一张上一张 1 1、提出假设提出假设:27.5:27.5第45页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 2 2、计算计算t t值值 第46页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 29.255第47页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 第48页,本讲稿共119页下一张下一张 主主
33、页页 退退 出出 上一张上一张 =0.862 所以所以 =2.036=2.036 第49页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 3 3、统计推断统计推断 由由df=n-1=9-1=8查临界查临界t值,得:值,得:计算所得的计算所得的 ,故,故p0.05,不能否定不能否定 ,表明新育成品种,表明新育成品种千粒重与当地良种汕优千粒重与当地良种汕优63的千粒重的千粒重差异不差异不显著显著,可以认为新育成品种千粒重与当地可以认为新育成品种千粒重与当地良种汕优良种汕优6363的千粒重相同的千粒重相同。第50页,本讲稿共119页 下一张下一张 主主 页页 退退 出出 上一张
34、上一张 第三节两个样本平均数差异第三节两个样本平均数差异 显著性检验显著性检验两个样本平均数差异显著性检验,因两个样本平均数差异显著性检验,因试验设计不同试验设计不同,分为,分为非配对设计非配对设计和和配对设配对设计计两种。两种。第51页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 一、非配对设计两个样本平均数一、非配对设计两个样本平均数 差异显著性检验差异显著性检验非配对设计非配对设计是将试验单位完全随机地分为是将试验单位完全随机地分为两组,然后再随机地对两组分别实施两个不同两组,然后再随机地对两组分别实施两个不同处理处理;两组试验单位相互独立,所得观测值相;两组试验
35、单位相互独立,所得观测值相互独立;两个处理的样本容量可以相等,也可互独立;两个处理的样本容量可以相等,也可以不相等,所得数据称为非配对数据。以不相等,所得数据称为非配对数据。这种设这种设计适用于试验单位比较一致的情况计适用于试验单位比较一致的情况。第52页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 【例【例45】测得马铃薯两个品种鲁引测得马铃薯两个品种鲁引1号号和大西洋的块茎干物质含量结果如和大西洋的块茎干物质含量结果如 表表 4-3 所所示。试检验两个品种马铃薯的块茎干物质含量示。试检验两个品种马铃薯的块茎干物质含量有无显著差异。有无显著差异。表表4-3 两个马铃薯
36、品种干物质含量(两个马铃薯品种干物质含量(%)第53页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 1 1、提出假设、提出假设 2、计算、计算t值值 第54页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 其中,其中,、,、分别为两样本含分别为两样本含量、平均数;量、平均数;为为样本均数差数标准样本均数差数标准误误,计算公式为,计算公式为 第55页,本讲稿共119页当当 时,时,下一张下一张 主主 页页 退退 出出 上一张上一张 其中,其中,、分别为两样本分别为两样本均方均方。第56页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上
37、一张 此例,此例,18.193,0.248,=6,=5第57页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 于是于是第58页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 3 3、统计推断、统计推断 根据根据 ,查附表查附表3得:得:=2.262 因为计算得的因为计算得的 1.922 ,故,故p0.05,不能否定,不能否定H0:,表明两个马铃,表明两个马铃薯品种的块茎干物质含量薯品种的块茎干物质含量差异不显著差异不显著,可以可以认为两个马铃薯品种的块茎干物质含量相同认为两个马铃薯品种的块茎干物质含量相同。第59页,本讲稿共119页下一张下一张 主主
38、 页页 退退 出出 上一张上一张 注意注意,两个样本平均数差异显著性检验的,两个样本平均数差异显著性检验的无效假设无效假设 与备择假设与备择假设 ,一般如前所述,一般如前所述,但也有例外。例如通过收益与成本的综合经济但也有例外。例如通过收益与成本的综合经济分析知道,施用高质量的肥料比施用普通肥料分析知道,施用高质量的肥料比施用普通肥料提高的成本需用产量提高提高的成本需用产量提高 个单位获得的收益个单位获得的收益来相抵,那么来相抵,那么在检验施用高质量的肥料比施用在检验施用高质量的肥料比施用普通肥料收益上是否有差异时普通肥料收益上是否有差异时,无效假设应无效假设应为为 ,备择假设为,备择假设为
39、(两尾检验);(两尾检验);第60页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 在检验施用高质量肥料的收益是否高于施在检验施用高质量肥料的收益是否高于施用普通肥料时用普通肥料时,无效假设应为,无效假设应为 ,备择假设为备择假设为 (一尾检验)。(一尾检验)。此时此时第61页,本讲稿共119页下一张下一张 主主 页页 退退 出出 上一张上一张 二、配对设计两个样本平均数二、配对设计两个样本平均数 差异显著性检验差异显著性检验 配对设计配对设计是指先根据配对的要求将试验单是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位位两两配对,然后将配成对子的两个试
40、验单位随机实施某一处理。随机实施某一处理。配对的要求配对的要求是,配成对子的两个试验单位是,配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处初始条件允许有差异,每一个对子就是试验处理的一个重复。理的一个重复。第62页,本讲稿共119页 例如例如,在,在相邻两个小区相邻两个小区、两个盆钵两个盆钵实施实施两种不同处理;在两种不同处理;在同一植株(或器官)的对同一植株(或器官)的对称部位称部位上实施两种不同处理;上实施两种不同处理;在同一供试单在同一供试单位上进行处理前和处理后的对比位上进行处理前和处理后的
41、对比等,都是配等,都是配对试验设计,所得观测值称为对试验设计,所得观测值称为成对数据成对数据。第63页,本讲稿共119页【例例47】选取生长期、发育进度、植选取生长期、发育进度、植株大小和其他方面皆比较一致的相邻的两块株大小和其他方面皆比较一致的相邻的两块地(每块地面积为地(每块地面积为666.7)的红心地瓜苗)的红心地瓜苗构成一组,共得构成一组,共得6组。组。每组中一块地按每组中一块地按标准标准化栽培化栽培,另一块地进行,另一块地进行绿色有机栽培绿色有机栽培,用来,用来研究不同栽培措施对产量的影响,得每块地研究不同栽培措施对产量的影响,得每块地瓜产量如表瓜产量如表4-4所示,试检验两种栽培方
42、式所示,试检验两种栽培方式差异是否显著。差异是否显著。第64页,本讲稿共119页表表表表4-4 两种栽培方法的地瓜产量两种栽培方法的地瓜产量(kg/666.7)第65页,本讲稿共119页采用两尾采用两尾t检验法。检验法。1 1、提出假设、提出假设 H0:;HA:。其中,其中,为第一个样本所在的总体平均数,为第一个样本所在的总体平均数,为第二个样本所在的总体平均数,为第二个样本所在的总体平均数,为两个样本各对数据之差数为两个样本各对数据之差数所在的总体平均数,所在的总体平均数,。第66页,本讲稿共119页2 2、计算、计算t t值值 第67页,本讲稿共119页其中,其中,为为差数标准差数标准误误
43、,为配对的对子数,为配对的对子数。本例,本例,1770.8+1449.7+1400.6 +(59.3)+(208.7)+(300.3)=675.467第68页,本讲稿共119页于是,于是,第69页,本讲稿共119页 3 3、统计推断、统计推断 查查 附附 表表 3,当,当 时时,=2.571=2.571,计算所得的,计算所得的 1.725 1.725 ,故,故 p p 0.05 0.05,不,不 能能 否否 定定 H0:,表明两种栽培方法的地瓜产,表明两种栽培方法的地瓜产量差异不显著,量差异不显著,可以认为两种栽培方法的地可以认为两种栽培方法的地瓜产量相同。瓜产量相同。第70页,本讲稿共119
44、页第四节第四节 百分率资料的显著性检验百分率资料的显著性检验 由具有两个属性类别的质量性状利用统由具有两个属性类别的质量性状利用统计次数法得来的次数资料进而计算出的百分计次数法得来的次数资料进而计算出的百分率资料,如结实率、发芽率、病株率、杂株率资料,如结实率、发芽率、病株率、杂株率以及一对性状的杂交后代中某一性状的植率以及一对性状的杂交后代中某一性状的植株占总株数的百分率等是株占总株数的百分率等是服从二项分布服从二项分布的。的。这类百分率资料的假设检验应按二项分这类百分率资料的假设检验应按二项分布进行。布进行。第71页,本讲稿共119页 当样本含量当样本含量n足够大足够大,p不过小,不过小,
45、np 和和nq均大于均大于5时,二项分布接近于正态分布,此时,二项分布接近于正态分布,此时可近似地采用时可近似地采用 u检验法检验法(称为(称为正态近似法正态近似法)对服从二项分布百分率资料进行差异显著性检对服从二项分布百分率资料进行差异显著性检验。验。适用于正态近似法所需的二项分布百分率适用于正态近似法所需的二项分布百分率资料的样本含量资料的样本含量n见表见表4-5。第72页,本讲稿共119页(样样本百分本百分率率)(较较小小组组的次数)的次数)(样样本容量)本容量)0.50.40.30.20.10.0515202440607030 50 80 200 600 1,400表表4-5 适用于正
46、态近似法所需要的二项适用于正态近似法所需要的二项 分布百分率资料的样本容量分布百分率资料的样本容量n第73页,本讲稿共119页一、样本百分率与总体百分率差一、样本百分率与总体百分率差异显著性检验异显著性检验检验一个服从二项分布的样本百分率检验一个服从二项分布的样本百分率与已知的二项总体百分率与已知的二项总体百分率p0 0差异是否显差异是否显著,其目的在于检验一个样本百分率著,其目的在于检验一个样本百分率 所所在二项总体百分率在二项总体百分率 p 是否与已知二项总体是否与已知二项总体百分率百分率p0相同相同,换句话说,检验该样本百,换句话说,检验该样本百分率分率 是否来自总体百分率为是否来自总体
47、百分率为p0 的二项的二项总体。总体。第74页,本讲稿共119页 这里所讨论的百分率是服从二项分布的这里所讨论的百分率是服从二项分布的,当满足当满足n n足够大,足够大,p p不过小,不过小,npnp和和nqnq均大于均大于5 5的条件时,可近似地采用的条件时,可近似地采用u u检验法,即正态检验法,即正态近似法来进行显著性检验;近似法来进行显著性检验;若若npnp和和nqnq均大均大于于3030,不必对,不必对u u进行连续性矫正进行连续性矫正。第75页,本讲稿共119页 【例例4848】用糯玉米和非糯玉米杂用糯玉米和非糯玉米杂交,预期交,预期F F1 1 植株上糯性花粉粒的百分率为植株上糯
48、性花粉粒的百分率为 =0.50=0.50。现检视。现检视150150粒花粉,得糯性花粉粒花粉,得糯性花粉6868粒,糯性花粉粒百分率粒,糯性花粉粒百分率 =0.453=0.453,问此,问此结果和理论百分率结果和理论百分率 =0.50=0.50是否相符?是否相符?第76页,本讲稿共119页 本本 例例 的的糯性花粉粒百分率服从二项分糯性花粉粒百分率服从二项分布布,但样本容量,但样本容量n=150n=150n=150n=150较大,较大,np=75 np=75 np=75 np=75、nq=75nq=75均均大于大于5(5(注意,此处假定注意,此处假定 ,来计算来计算npnp和和nq)nq),所
49、以采,所以采用用正态近似法正态近似法来进行显著性检验;来进行显著性检验;且要回答且要回答的问题是糯性花粉粒样本百分率的问题是糯性花粉粒样本百分率 =0.453=0.453=0.453=0.453 与与理论百分率理论百分率 =0.50=0.50=0.50=0.50是否相符,是否相符,故采用故采用两尾两尾u u检验检验;由于;由于np=75np=75np=75np=75、nq=75nq=75nq=75nq=75均大于均大于 30303030,不必对不必对u u进行连续性矫正进行连续性矫正。第77页,本讲稿共119页检验步骤如下:检验步骤如下:1 1、统计假设、统计假设H H0 0:H HA A:2
50、 2、计算、计算u u值值 第78页,本讲稿共119页其中其中,为样本百分率,为样本百分率,=0.5 =0.5为已知为已知总体百分率,总体百分率,为为样本百分率标准误样本百分率标准误:其中,其中,n n为样本容量。为样本容量。第79页,本讲稿共119页 本例,本例,于是,于是,第80页,本讲稿共119页 3 3、统计推断、统计推断 计算所得的计算所得的 ,故,故p p0.050.05,不能否定,不能否定H H0 0:,表明糯,表明糯性花粉样本百分率性花粉样本百分率 0.453 0.453 和和 差异不显著差异不显著 ,可以认为糯性花粉粒样本百分可以认为糯性花粉粒样本百分率率 =0.453 =0