《试验设计与统计分析 精.ppt》由会员分享,可在线阅读,更多相关《试验设计与统计分析 精.ppt(64页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、试验设计与统计分析 第1页,本讲稿共64页Section 5.1Principle of Significance Tests假设测验的基本原理第2页,本讲稿共64页一、假设测验的理论基础某人宣称自由球命中率有80%。命中率有80%的射手,实地投射只有8/20命中率的机会不大。实地投射结果显示投20球中8球。结论:命中率有80%的宣称不可信。命中率有80%的自由球射手投20球命中的次数应服从二项分布B(20,0.8)。命中的次数小于或等于8的概率约为 0.0001。即重复实地投射20球10,000次只中8球以下的情形约只发生一次。第3页,本讲稿共64页假设宣称的叙述为真(命中率有80%),可推
2、得实验结果发生的可能性很低,则该实验结果的发生(实地投射20球中8球),即为宣称的叙述不真的好证据。“Prove by Contradiction”小概率原理一、假设测验的理论基础第4页,本讲稿共64页例例 某地区的当地小麦品种一般某地区的当地小麦品种一般667m2产产300kg,即当地品种,即当地品种这个总体的平均数这个总体的平均数 =300(kg),并从多年种植结果获得其标准,并从多年种植结果获得其标准差差=75(kg),而现有某新品种通过,而现有某新品种通过25个小区的试验,计得其样个小区的试验,计得其样本平均产量为每本平均产量为每667m2330kg,即即 =330,问新品种产量与当地
3、品种产量是否有显著差异?,问新品种产量与当地品种产量是否有显著差异?二、假设测验的步骤第5页,本讲稿共64页 (一一)先假设新品种产量与当地品种产量无差异,记作先假设新品种产量与当地品种产量无差异,记作 无效假设或零假设无效假设或零假设 对立假设或备择假设对立假设或备择假设 二、假设测验的步骤第6页,本讲稿共64页二、假设测验的步骤 (二二)在承认上述无效假设的前提下,获得平均数的抽样在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率分布,计算假设正确的概率 先承认无效假设,从已知总体中抽取样本容量为先承认无效假设,从已知总体中抽取样本容量为n=25的样本,的样本,该样本平均
4、数的抽样分布具正态分布形状,平均数该样本平均数的抽样分布具正态分布形状,平均数 =300(kg),标准误,标准误 =15(kg)。如果新品种的。如果新品种的平均产量很接近平均产量很接近300 kg,应接受,应接受H0。如果新品种的平均产量与。如果新品种的平均产量与300相差很大,应否定相差很大,应否定H0。但如果试验结果与。但如果试验结果与300不很接近也不不很接近也不相差悬殊相差悬殊,就要借助于概率原理,具体做法有以下两种:就要借助于概率原理,具体做法有以下两种:第7页,本讲稿共64页1.计算概率计算概率 在假设在假设 为正确的条件下,根据的抽样分布算出获得为正确的条件下,根据的抽样分布算出
5、获得 330kg的概率,或者说算得出现随机误差的概率,或者说算得出现随机误差 30(kg)的概率:在此,的概率:在此,查附表,当查附表,当u=2时,时,P(概率概率)界于界于0.04和和0.05之间,即这一试验之间,即这一试验结果:结果:30(kg),属于抽样误差的概率小于,属于抽样误差的概率小于5%。二、假设测验的步骤第8页,本讲稿共64页2.计算接受区和否定区计算接受区和否定区 在假设在假设H0为正确的条件下,根据为正确的条件下,根据 的抽样分的抽样分布划出一个区间,如布划出一个区间,如 在这一区间内则接受在这一区间内则接受H0,如,如 在这一区间外则否在这一区间外则否定定H0。由于。由于
6、 因此,在因此,在 的抽样分布中,落在的抽样分布中,落在()区间内的有区间内的有95%,落在这一区间外的只有,落在这一区间外的只有5%。二、假设测验的步骤第9页,本讲稿共64页 如果以如果以5%概率作为接受或否定概率作为接受或否定H0的界限,则上述区间的界限,则上述区间()为接受假设的区域,简称为接受假设的区域,简称接受区接受区(acceptance region)(acceptance region);和和 为否定假设的区域,简称为否定假设的区域,简称否定区否定区(rejection region)(rejection region)。同理,若以同理,若以1%作为接受或否定作为接受或否定H0
7、的界限,则的界限,则()为接受区域,为接受区域,和和 为否定区域。为否定区域。二、假设测验的步骤第10页,本讲稿共64页 如上述小麦新品种例,如上述小麦新品种例,=300,,1.96 =29.4(kg)。因之,它。因之,它的两个的两个2.5%概率概率的否定区域为的否定区域为 30029.4和和 300+29.4,即,即大于大于329.4(kg)和小于和小于270.6(kg)的概率只有的概率只有5。图图 5%显著水平假设测验图示显著水平假设测验图示(表示接受区域和否定区域)(表示接受区域和否定区域)二、假设测验的步骤第11页,本讲稿共64页(三三)根据根据“小概率事件实际上不可能发生小概率事件实
8、际上不可能发生”原理接受或否定假设原理接受或否定假设 当当 由随机误差造成的概率由随机误差造成的概率P小于小于5%或或1%时,就可认为它时,就可认为它不可能属于抽样误差,从而否定假设。不可能属于抽样误差,从而否定假设。如如P0.05,则称这个差数是显著的。,则称这个差数是显著的。如如P 0假设:否定区H0:0 HA:0左尾测验右尾测验单尾测验单尾测验(one-sided test)接受区接受区三、两尾测验与一尾测验第16页,本讲稿共64页u 0.05=1.64u 0.01=2.33单尾测验分位数双尾测验分位数u 0.05=1.96u 0.01=2.58 否定区否定区否定区接受区接受区查表时,单
9、尾概率等于双尾概率乘以2三、两尾测验与一尾测验第17页,本讲稿共64页假设测验的两类错误假设测验的两类错误H0正确正确 H0 错误错误否定否定H0 错误错误()推断正确推断正确(1-)接受接受H0 推断正确推断正确(1-)错误错误()第一类错误(第一类错误(type I error),又称弃真错误或),又称弃真错误或 错误错误;第二类错误(第二类错误(type II error),又称纳伪错误或,又称纳伪错误或 错误错误第一类错误的概率为显著水平第一类错误的概率为显著水平 值。值。第二类错误的概率为第二类错误的概率为 值。值。四、假设测验的两类错误第18页,本讲稿共64页关于两类错误的讨论可总
10、结如下:关于两类错误的讨论可总结如下:(1)在样本容量在样本容量n固定的条件下,提高显著水平固定的条件下,提高显著水平 (取较小的取较小的 值值),如从,如从5%变为变为1%则将增大第二类错误的概率则将增大第二类错误的概率 值。值。(2)在在n和显著水平和显著水平 相同的条件下,真总体平均数相同的条件下,真总体平均数 和假设平均数和假设平均数 的相差的相差(以标准误为单位以标准误为单位)愈大,则犯第二类错误的概率愈大,则犯第二类错误的概率 值愈小。值愈小。(3)为了降低犯两类错误的概率,需采用一个较低的显著水平,如为了降低犯两类错误的概率,需采用一个较低的显著水平,如 =0.05;或适当增加样
11、本容量。;或适当增加样本容量。(4)如果显著水平如果显著水平 已固定下来,则改进试验技术和增加样本容量可已固定下来,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。以有效地降低犯第二类错误的概率。四、假设测验的两类错误第19页,本讲稿共64页Section 5.2 Significance Tests for Means平均数的假设测验第20页,本讲稿共64页一、t分布数据来自正态总体N(,2)的假设下,随机样本的均数 服从正态 N(,2/n)标准差未知,用样本标准差s估计 以 标准化后服从标准正态 以 标准化后则服从 t 分布 的标准差估计值 又称为 的标准误(standard
12、 error of mean,简记为 )第21页,本讲稿共64页0 0标准正态分布t 分布自由度9t 分布自由度2一、t分布第22页,本讲稿共64页t 分布图形与正态分布图形相似都具有对称于零、单峰及钟形的特性t 分布图形的散布(spread)比正态分布图形大,t 分布图形的尾端具有较大的概率以 替代 来标准化,使得t分布有较大的变异性。t分布自由度越大图形越接近正态。样本容量越大s估计越可靠,估计值造成的额外变异性越小。一、t分布第23页,本讲稿共64页在自由度为 的t分布曲线图下,右方与 左方的面积和为 ,则称 为自由度为 的t分布概率为 的双侧临界值。可查表。0面积为/2面积为/2一、t
13、分布第24页,本讲稿共64页在自由度为 的t分布曲线图下,右方的面积为 ,则称 为自由度为 的t分布概率为 的单侧临界值。可查表。0面积为一、t分布第25页,本讲稿共64页-tt0一、t分布第26页,本讲稿共64页t 界值表界值表1.8122.228-2.228tf(t)=10=10的的t t分布图分布图第27页,本讲稿共64页 例例1 某春小麦良种的千粒重某春小麦良种的千粒重 34g,现自外地引入一,现自外地引入一高产品种,在高产品种,在8个小区种植,得其千粒重个小区种植,得其千粒重(g)为:为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千
14、粒重,问新引入品种的千粒重与当地良种有无显著差异?与当地良种有无显著差异?这里总体这里总体 为未知,又是小样本,故需用为未知,又是小样本,故需用t 测验;又新引入品种测验;又新引入品种千粒重可能高于也可能低于当地良种,故需作两尾测验。测验步骤为:千粒重可能高于也可能低于当地良种,故需作两尾测验。测验步骤为:二、单个样本平均数的假设测验第28页,本讲稿共64页H0:34g;对;对HA:34g。显显著水平著水平 =0.05。测验计算:测验计算:查附表查附表,v=7时,时,t0.05=2.365。现实得。现实得|t|0.05。推断:接受推断:接受H0:34g,即新引入品种千粒重与当地良种千粒重指定值
15、,即新引入品种千粒重与当地良种千粒重指定值没有显著差异。没有显著差异。二、单个样本平均数的假设测验第29页,本讲稿共64页 由两个样本平均数的相差,以测验这两个样本所属的总体平由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。均数有无显著差异。测验方法测验方法 成组数据的平均数比较成组数据的平均数比较 成对数据的比较成对数据的比较 三、两个样本平均数相比较的假设测验第30页,本讲稿共64页(一一)成组数据的平均数比较成组数据的平均数比较 如果两个处理为完全随机设计的两个处理,各供试单如果两个处理为完全随机设计的两个处理,各供试单位彼此独立,不论两个处理的样本容量是否相同,所
16、得数位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组据皆称为成组数据,以组(处理处理)平均数作为相互比较的标平均数作为相互比较的标准。准。在两个样本的总体方差在两个样本的总体方差 和和 为未知,但可假定为未知,但可假定 ,而两个样本又为小样本时,用,而两个样本又为小样本时,用t t 测验。测验。三、两个样本平均数相比较的假设测验第31页,本讲稿共64页从样本变异算出平均数差数的均方从样本变异算出平均数差数的均方 ,其两样本平均数的差数标准误为:其两样本平均数的差数标准误为:于是有:于是有:由于假设由于假设 故故自由度自由度 三、两个样本平均数相比较的假设测验第32页,本
17、讲稿共64页 例例2 调查某农场每亩调查某农场每亩30万苗和万苗和35万苗的稻田各万苗的稻田各5块,得亩产量块,得亩产量(单单位:位:kg)于表于表1,试测验两种密度亩产量的差异显著性。,试测验两种密度亩产量的差异显著性。表表1 1 两种密度的稻田两种密度的稻田亩产亩产(kg)(kg)y1(30万苗万苗)y2(35万苗万苗)400450420440435445460445425420 假设假设H0:两种密度的总体产量没有两种密度的总体产量没有差异,即差异,即 对对 显著水平显著水平 =0.05 测验计算:测验计算:=428kg =440kg SS1=1930 SS2=550 故故 三、两个样本
18、平均数相比较的假设测验第33页,本讲稿共64页 查附表,查附表,v=4+4=8时时,t0.05=2.306。现实得现实得|t|=1.080.05。推断:接受假设推断:接受假设 ,两种密度的亩产量没有显著,两种密度的亩产量没有显著差异。差异。三、两个样本平均数相比较的假设测验第34页,本讲稿共64页(二二)成对数据的比较成对数据的比较 若试验设计是将性质相同的两个供试单位配成一对,并设若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为不同处理,则所得观察值为成对数据
19、成对数据。成对数据,由于同一配对内两个供试单位的试验条件很是接近,而成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。制试验误差,具有较高的精确度。在分析试验结果时,只要假设两样本的总体差数的平均在分析试验结果时,只要假设两样本的总体差数的平均数数 ,而不必假定两样本的总体方差,而不必假定两样本的总体方差 和和 相同。相同。三、两个样本平均数相比较的假设测验第35页,本讲稿共64页 设两个样本的观察值分别为设两个样本的观察值分别为x1
20、和和 x2,共配成,共配成n对,各个对的差数对,各个对的差数为为 d=x1x2,差数的平均数为,差数的平均数为 ,则差数平均数的标准,则差数平均数的标准误误 为:为:它具有它具有 v=n1。若假设。若假设 ,则上式改为:,则上式改为:即可测验即可测验 三、两个样本平均数相比较的假设测验第36页,本讲稿共64页 例例3 选生长期、发育进度、选生长期、发育进度、植株大小和其他方面皆比较一致植株大小和其他方面皆比较一致的两株番茄构成一组,共得的两株番茄构成一组,共得7组,组,每组中一株接种每组中一株接种A处理病毒,另处理病毒,另一株接种一株接种B处理病毒,以研究不同处理病毒,以研究不同处理方法的饨化
21、病毒效果,表处理方法的饨化病毒效果,表2结结果为病毒在番茄上产生的病痕果为病毒在番茄上产生的病痕数目,试测验两种处理方法的数目,试测验两种处理方法的差异显著性。差异显著性。表表2 A、B两法两法 处处理理的病毒在番茄上的病毒在番茄上产产生的病痕数生的病痕数组组 别别y1(A法法)y2(B法法)d11025152131213814643151255127620277761812三、两个样本平均数相比较的假设测验第37页,本讲稿共64页 假设:两种处理对饨化病毒无不同效果,即假设:两种处理对饨化病毒无不同效果,即 ;对;对 。显著水平显著水平 。查附表查附表,v=7-1=6时时,t0.01=3.7
22、07。实得现。实得现|t|t0.01,故,故P0.01。推断:否定推断:否定 ,接受,接受 ,即,即A、B两法对饨化病毒的两法对饨化病毒的效应有极显著差异。效应有极显著差异。三、两个样本平均数相比较的假设测验第38页,本讲稿共64页 成对数据和成组数据平均数比较的不同成对数据和成组数据平均数比较的不同:(1)成对数据和成组数据平均数比较所依据的条件不同。成对数据和成组数据平均数比较所依据的条件不同。前者是假定各个配对的差数来自差数的分布为正态的总体前者是假定各个配对的差数来自差数的分布为正态的总体,具具有有N(0,);而每一配对的两个供试单位是彼此相关的。;而每一配对的两个供试单位是彼此相关的
23、。后者则是假定两个样本皆来自具有共同后者则是假定两个样本皆来自具有共同(或不同或不同)方差的正态总体,方差的正态总体,而两个样本的各个供试单位都是彼此独立的。而两个样本的各个供试单位都是彼此独立的。(2)在实践上,如将成对数据按成组数据的方法比较,容易使统在实践上,如将成对数据按成组数据的方法比较,容易使统计推断发生第二类错误,即不能鉴别应属显著的差异。故在应用时需计推断发生第二类错误,即不能鉴别应属显著的差异。故在应用时需严格区别。严格区别。三、两个样本平均数相比较的假设测验第39页,本讲稿共64页Section 5.3 Significance Tests for Proportion 百
24、分数的假设测验第40页,本讲稿共64页 测验某一样本百分数测验某一样本百分数 所属总体百分数与某一理论值或期望所属总体百分数与某一理论值或期望值值p0的差异显著性。的差异显著性。由于样本百分数的标准误由于样本百分数的标准误 为:为:故由故由 即可测验即可测验H0:p=p0。一、单个样本百分数(成数)的假设测验第41页,本讲稿共64页 例例4 以紫花和白花的大豆品种杂交,在以紫花和白花的大豆品种杂交,在F2代共得代共得289株,其株,其中紫花中紫花208株,白花株,白花81株。如果花色受一对等位基因控制,则根据株。如果花色受一对等位基因控制,则根据遗传学原理,遗传学原理,F2代紫花株与白花株的分
25、离比率应为代紫花株与白花株的分离比率应为31,即紫花理论,即紫花理论百分数百分数p=0.75,白花理论百分数,白花理论百分数q=1p=0.25。问该试验结果是否符。问该试验结果是否符合一对等位基因的遗传规律?合一对等位基因的遗传规律?一、单个样本百分数(成数)的假设测验第42页,本讲稿共64页因为实得因为实得|u|0.05。推断:接受推断:接受H0:p=0.75,即大豆花色遗传是符合一对等位基因的,即大豆花色遗传是符合一对等位基因的遗传规律的,紫花植株百分数遗传规律的,紫花植株百分数 =0.72和和p=0.75的相差系随机误差。的相差系随机误差。如果测验如果测验H0:p=0.25,结果完全一样
26、。,结果完全一样。假设大豆花色遗传符合一对等位基因的分离规律,紫花植株的百分假设大豆花色遗传符合一对等位基因的分离规律,紫花植株的百分数是数是75%,即,即H0:p=0.75;对;对HA:p0.75。显著水平显著水平 0.05,作两尾测验,作两尾测验,u0.05=1.96。测验计算:测验计算:一、单个样本百分数(成数)的假设测验第43页,本讲稿共64页 测验两个样本百分数和所属总体百分数测验两个样本百分数和所属总体百分数p1和和p2的差异显著性的差异显著性.设两个样本某种属性个体的观察百分数分别为设两个样本某种属性个体的观察百分数分别为 和和 ,而两样本总体该种属性的个体百分数分别为,而两样本
27、总体该种属性的个体百分数分别为p1和和 p2,则两样本百分数的差数标准差,则两样本百分数的差数标准差 为:为:即可对即可对 H0:p1=p2 作出假设测验。作出假设测验。故由故由二、两个样本百分数(成数)的假设测验第44页,本讲稿共64页 例例5 调查低洼地小麦调查低洼地小麦378株株(n1),其中有锈病株,其中有锈病株355株株(x1),锈病率,锈病率93.92%();调查高坡地小麦;调查高坡地小麦396株株(n2),其中,其中有锈病有锈病346株株(x2),锈病率,锈病率87.31%()。试测验两块麦田的锈病。试测验两块麦田的锈病率有无显著差异?率有无显著差异?假设假设H0:两块麦田的总体
28、锈病率无差别,即:两块麦田的总体锈病率无差别,即 H0:p1=p2;对;对 HA:p1 p2。取。取 ,两尾测验,两尾测验,u0.05=1.96。测验计算:测验计算:二、两个样本百分数(成数)的假设测验第45页,本讲稿共64页实得实得|u|u0.05,故,故P0.05,推断:否定推断:否定H0:p1=p2 接受接受HA:p1 p2,即两块麦田的锈,即两块麦田的锈病率有显著差异。病率有显著差异。二、两个样本百分数(成数)的假设测验第46页,本讲稿共64页Section 5.4 Estimating Confidence Interval 区间估计第47页,本讲稿共64页 所谓所谓参数的区间估计参
29、数的区间估计,是指在一定的概率保证之下是指在一定的概率保证之下,估计估计出一个范围或区间以能够覆盖参数。出一个范围或区间以能够覆盖参数。这个区间称这个区间称置信区间置信区间(confidence interval)(confidence interval),区间的上、下限,区间的上、下限称为称为置信限置信限(confidence limit)(confidence limit),区间的长度称为,区间的长度称为置信距置信距。一般以一般以L1和和L2分别表示置信下限和上限。分别表示置信下限和上限。保证该区间能覆盖参数的概率以保证该区间能覆盖参数的概率以P=(1 )表示,称为表示,称为置信系置信系数
30、或置信度数或置信度。一、什么是区间估计第48页,本讲稿共64页并有并有 在总体方差在总体方差 为未知时为未知时 置信区间为:置信区间为:上式中的上式中的 为置信度为置信度P=(1 )时时 t 分布的分布的 t 临界值。临界值。二、单一总体平均数的置信区间第49页,本讲稿共64页 例例6 例例1已算得某春小麦良种在已算得某春小麦良种在8个小区的千粒重平均数个小区的千粒重平均数 ,。试估计在置信度为。试估计在置信度为95%时该品种的千粒重范围。时该品种的千粒重范围。由附表查得由附表查得 v=7时时 t0.05=2.365,故有,故有 ,即即 推断:该品种总体千粒重在推断:该品种总体千粒重在33.8
31、36.6g之间的置信度为之间的置信度为95%。在表达时亦可写作在表达时亦可写作 形式,即该品种总体千粒重形式,即该品种总体千粒重95%置信度的置信度的区间是区间是35.2(2.3650.58)=35.21.4(g),即,即33.836.6g。二、单一总体平均数的置信区间第50页,本讲稿共64页三、两总体平均数差数的置信区间(一一)成组数据成组数据 如果两总体方差未知,但相等,即如果两总体方差未知,但相等,即 ,则,则 的的1-置信区间为:置信区间为:并有并有 以上的以上的 为平均数差数标准误,为平均数差数标准误,是置信度为是置信度为1 ,自,自由度为由度为 v=n1+n22 时时 t 分布的临
32、界值。分布的临界值。第51页,本讲稿共64页 例例7 试估计例试估计例2资料两种密度资料两种密度667m2产量差数在置信度为产量差数在置信度为99%时时的置信区间。的置信区间。在前面已算得:在前面已算得:由附表查得由附表查得 v=8 时,时,t0.01=3.355 故有故有 L1=(428440)(3.35511.136)=49.4,L2=(428440)+(3.35511.136)=25.4(kg)。结结果果说说明,明,667m2栽栽30万万亩亩苗的苗的产产量可以比量可以比667m2栽栽35万苗的每万苗的每亩亩少收少收49.4kg至每至每亩亩多收多收25.4kg,波,波动动很大。所以很大。所
33、以这这个例子是接受个例子是接受 的的.的。三、两总体平均数差数的置信区间第52页,本讲稿共64页(二二)成对数据成对数据由由可得可得 的的1-置信区间置信区间:并有并有 为置信度为为置信度为1 ,v=n1时时 t 分布的临界分布的临界 t 值。值。其中其中三、两总体平均数差数的置信区间第53页,本讲稿共64页 例例8 试求例试求例3资料资料 的的99%置信限。置信限。在例在例3已算得:已算得:并由附表查得并由附表查得 v=6 时时 t0.01=3.707 于是有于是有:L1=8.3(3.7071.997)=15.7(个个),L2=8.3+(3.7071.997)=0.9(个个)。或写作或写作
34、以上以上L1和和L2皆为负值,表明皆为负值,表明A法处理病毒在番茄上产生的病痕数法处理病毒在番茄上产生的病痕数要比要比B法减小法减小0.915.7个,此估计的置信度为个,此估计的置信度为99%。三、两总体平均数差数的置信区间第54页,本讲稿共64页(一一)单一总体百分数的置信区间单一总体百分数的置信区间在置信度在置信度P=1 下,对总体下,对总体p置信区间的近似估计为:置信区间的近似估计为:并有并有 以上式中以上式中 四、百分数的置信区间第55页,本讲稿共64页 例例9 调查调查100株玉米,得到受玉米螟危害的为株玉米,得到受玉米螟危害的为20株,即株,即 =20/100=0.2或或 =20。
35、试计算。试计算95%置信度的玉米螟危害率置信区间。置信度的玉米螟危害率置信区间。故故 L1=0.2(1.960.04)=0.1216,L2=0.2+(1.960.04)=0.2784四、百分数的置信区间第56页,本讲稿共64页(二二)两个二项总体百分数差数的置信区间两个二项总体百分数差数的置信区间在在1 的置信度下,的置信度下,p1p2 的置信区间为:的置信区间为:并有并有 其中其中四、百分数的置信区间第57页,本讲稿共64页 例例10 例例5已测知低洼地小麦的锈病率已测知低洼地小麦的锈病率 =93.92%(n1=378),高坡地小麦的锈病率,高坡地小麦的锈病率 =87.31%(n2=396)
36、,它们有显著差,它们有显著差异。试按异。试按95%置信度估计两地锈病率相差的置信区间。置信度估计两地锈病率相差的置信区间。由附表查得由附表查得 u0.05=1.96,而,而故有故有 L1=(0.93920.8731)(1.960.02075)=0.0256,L2=(0.93920.8731)+(1.960.02075)=0.1070,即低洼地,即低洼地的锈病率比高坡地高的锈病率比高坡地高2.5610.70%,此估计的置信度为,此估计的置信度为95%。四、百分数的置信区间第58页,本讲稿共64页Section 5.5 Relation between Confidence Interval an
37、d Significance Tests 区间估计与假设测验的关系第59页,本讲稿共64页 区间估计亦可用于假设测验。区间估计亦可用于假设测验。对参数所作假设若恰落在该范围内,则这个假设与参数就没有对参数所作假设若恰落在该范围内,则这个假设与参数就没有真实的不同,因而接受真实的不同,因而接受 H0;反之,如果对参数所作的假设落在置信区间之外,则说明反之,如果对参数所作的假设落在置信区间之外,则说明假设与参数不同,所以应否定假设与参数不同,所以应否定 H0,接受,接受 HA。第60页,本讲稿共64页 例例11 例例1已算得新引入春小麦品种的千粒重,故其已算得新引入春小麦品种的千粒重,故其95%置
38、信区置信区间的两个置信限为:间的两个置信限为:L1=35.2(2.3650.58)=33.8(g)L2=35.2+(2.3650.58)=36.6(g)曾经假设曾经假设 ,此值落在上述置信区间内,所以不能认为,此值落在上述置信区间内,所以不能认为新引入品种与当地原有良种的千粒重有显著差异,即接受新引入品种与当地原有良种的千粒重有显著差异,即接受 。这和例这和例1的结论完全相同。的结论完全相同。第61页,本讲稿共64页 例例12 在例在例3已求得两种不同处理的病毒,接种在番茄上已求得两种不同处理的病毒,接种在番茄上产生的病痕数的相差,在产生的病痕数的相差,在1 置信度下的区间为置信度下的区间为
39、(个个)。如果假设如果假设 ,则该区间内并不包括,则该区间内并不包括0值,所以,两值,所以,两种处理方法是有显著差异的,显著水平是种处理方法是有显著差异的,显著水平是0.05。其结论与。其结论与例例3同。同。第62页,本讲稿共64页 例例13 在例在例10已求得低洼地小麦锈病率与高坡地小麦锈病率的相已求得低洼地小麦锈病率与高坡地小麦锈病率的相差的差的95%置信区间为:置信区间为:2.56%(p1p2)10.7%。若假设若假设H0:p1=p2,则该假设在上述置信区间外,故在,则该假设在上述置信区间外,故在 =0.05水平上否定水平上否定 H0,接受,接受 HA:p1p2 0。第63页,本讲稿共6
40、4页区间估计与假设测验关系总结为以下几点:区间估计与假设测验关系总结为以下几点:(1)若在若在1 的置信度下,两个置信限同为正号或同为负号,则的置信度下,两个置信限同为正号或同为负号,则否定无效假设,而接受备择假设。否定无效假设,而接受备择假设。(2)若在若在1 置信度下,两个置信限为异号置信度下,两个置信限为异号(一正一负一正一负),即其区,即其区间包括零值,则无效假设皆被接受。间包括零值,则无效假设皆被接受。(3)若两个置信限皆为正号,则有一个参数大于另一个参数的结若两个置信限皆为正号,则有一个参数大于另一个参数的结论成立。论成立。(4)若两个置信限皆为负号,则有一个参数小于另一个参数若两个置信限皆为负号,则有一个参数小于另一个参数的结论成立。的结论成立。第64页,本讲稿共64页