《试验设计与分析园艺第三章统计推断幻灯片.ppt》由会员分享,可在线阅读,更多相关《试验设计与分析园艺第三章统计推断幻灯片.ppt(104页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、试验设计与分析园艺第三章统计推断第1页,共104页,编辑于2022年,星期二n第一节第一节 参数估计参数估计 n第二节第二节 统计假设测验的原理统计假设测验的原理n第三节第三节 样本平均数的显著性测验样本平均数的显著性测验 n第四节第四节 统计假设测验的两类错误统计假设测验的两类错误 第2页,共104页,编辑于2022年,星期二第一节第一节 参数估计参数估计n统计推断的内容统计推断的内容q总体的参数估计总体的参数估计q总体的假设检验总体的假设检验n参数估计:总体参数未知时,需要从总体抽出一个样本参数估计:总体参数未知时,需要从总体抽出一个样本对未知参数进行估计。分为对未知参数进行估计。分为点估
2、计点估计和和区间估计区间估计。q点估计是对参数点估计是对参数真值真值的估计的估计q区间估计是对参数区间估计是对参数真值取值范围真值取值范围的估计的估计第3页,共104页,编辑于2022年,星期二一、参数的点估计一、参数的点估计 (1)点估计的定义)点估计的定义n假设总体假设总体x 的分布函数的形式已知,但含有未知参数的分布函数的形式已知,但含有未知参数。x1、x2、xn为总体的一个样本,构造一个为总体的一个样本,构造一个 的的统计量统计量(如平均数),将所测得的样本值代入统计(如平均数),将所测得的样本值代入统计量,就会得到量,就会得到 ,那么就称,那么就称 为未知参数为未知参数 的估计值。的
3、估计值。第4页,共104页,编辑于2022年,星期二(2)评价估计量优劣的标准评价估计量优劣的标准n无偏性无偏性:如果:如果 的数学期望值存在,且等于待估参的数学期望值存在,且等于待估参数数,就是就是 的无偏估计。的无偏估计。n有效性有效性:如果:如果 和和 都是都是 的无偏估计,但的无偏估计,但 的方差的方差小于小于 的方差,我们就说的方差,我们就说 比比 有效。有效。n一致性一致性:对任意小的正数:对任意小的正数,成立,成立,则称则称 是参数是参数 的一致估计量。的一致估计量。第5页,共104页,编辑于2022年,星期二二、参数的区间估计二、参数的区间估计(1)点估计的缺点)点估计的缺点n
4、只给出了总体参数的估计值,没有考虑只给出了总体参数的估计值,没有考虑试验误差试验误差的影响,的影响,从总体中抽取不同的样本,可能得到不同的结果。从总体中抽取不同的样本,可能得到不同的结果。n没有指出估计的没有指出估计的可靠程度可靠程度。第6页,共104页,编辑于2022年,星期二(2)区间估计相关概念)区间估计相关概念n区间估计区间估计:在一定概率保证下给出总体参数的可能范:在一定概率保证下给出总体参数的可能范围围n置信区间置信区间:所给出的可能范围:所给出的可能范围n置信限置信限:置信区间的上、下限,用:置信区间的上、下限,用L1和和L2表示表示n置信距置信距:置信区间的长度:置信区间的长度
5、n置信度置信度:所给出的概率保证,也称置信概率,用:所给出的概率保证,也称置信概率,用P=(1)表示)表示第7页,共104页,编辑于2022年,星期二(3)区间估计的原理)区间估计的原理n置信度置信度1反映了区间估计的可信度,常取反映了区间估计的可信度,常取0.90、0.95和和0.99。n置信距反映了区间估计的精确度。置信距反映了区间估计的精确度。n在保证置信度在保证置信度1的前提下,置信区间越短越好的前提下,置信区间越短越好。第8页,共104页,编辑于2022年,星期二(4)进行区间估计的一般步骤:)进行区间估计的一般步骤:n首先,构造一个与待估计参数首先,构造一个与待估计参数 有关的统计
6、量有关的统计量 ;n其次,找出统计量其次,找出统计量 的分布,在一定的置信度下,给出的分布,在一定的置信度下,给出临界值;临界值;n最后,计算总体参数最后,计算总体参数 的置信区间。的置信区间。第9页,共104页,编辑于2022年,星期二三、正态总体平均数三、正态总体平均数的置信区间的置信区间(1)总体方差总体方差2已知已知时,时,的置信区间为的置信区间为n其中,其中,u为正态分布下置信度为为正态分布下置信度为1时时u的临界值。的临界值。第10页,共104页,编辑于2022年,星期二应用举例应用举例n某棉花株行圃某棉花株行圃36个单行的皮棉平均产量为个单行的皮棉平均产量为 4.1kg,已知已知
7、0.3kg,求,求99%置信度下该株行皮棉产量置信度下该株行皮棉产量的的置信区间。置信区间。第11页,共104页,编辑于2022年,星期二q置信度置信度P=(1)0.99,0.01,则,则u0.012.58q由于由于q置信区间为置信区间为(4.12.580.05)(4.12.58 0.05),即,即3.9714.229q推断:该株行圃皮棉平均产量在推断:该株行圃皮棉平均产量在3.9714.229kg之间,此之间,此估计值的可靠度有估计值的可靠度有99%。q0.05时,平均产量在时,平均产量在4.0024.198kg之间之间 第12页,共104页,编辑于2022年,星期二(2)总体方差)总体方差
8、2未知但为大样本未知但为大样本时,时,用样本方差用样本方差s2 代代替替2,的置信区间为的置信区间为(3)总体方差)总体方差2未知且为小样本未知且为小样本时,时,用样本方差用样本方差s2 估估计计2,的置信区间为的置信区间为 其中,其中,t为为t分布分布下置信度为下置信度为1时时t的临界值。的临界值。第13页,共104页,编辑于2022年,星期二t 分布分布n由样本平均数抽样分布的性质知道:若由样本平均数抽样分布的性质知道:若xN(,2),则,则 N(,2/n)。将随机变量标准化:。将随机变量标准化:,则,则uN(0,1)。n当总体标准差当总体标准差未知时,如果为大样本,可以用样本标准差未知时
9、,如果为大样本,可以用样本标准差s直接直接代替代替使用。使用。n如果为小样本,那么用如果为小样本,那么用s代替代替所得到的统计数记为所得到的统计数记为t,即,即 。n由于用由于用s代替代替,t变量不再服从标准正态分布,而是服从自由变量不再服从标准正态分布,而是服从自由度度dfn1的的t分布,分布,t的取值范围是的取值范围是(,)。n附表附表5中数字为两尾临界中数字为两尾临界t值。值。第14页,共104页,编辑于2022年,星期二应用举例应用举例n某春小麦良种在某春小麦良种在8个小区的平均千粒重个小区的平均千粒重 ,。试估计在置信度为。试估计在置信度为95%时该品种的千时该品种的千粒重范围。粒重
10、范围。n由附表由附表4,t 0.05(7)2.365,95%置信区间为置信区间为(35.22.3650.58)(35.22.3650.58),即,即33.836.6n推断:该品种的千粒重范围在推断:该品种的千粒重范围在33.836.6g之间,此之间,此估计值的可靠度有估计值的可靠度有95%。也可以写作。也可以写作35.22.3560.5835.21.4g,即,即33.836.6g。第15页,共104页,编辑于2022年,星期二四、两总体平均数差数四、两总体平均数差数(12)的的 置信区间置信区间 (1)两总体方差已知两总体方差已知时,时,12在在1置信度下的置信置信度下的置信区间为区间为(2)
11、两总体方差未知但为大样本两总体方差未知但为大样本时,用时,用s1、s2分别代替分别代替1、2,12在在1置信度下的置信区间为置信度下的置信区间为第16页,共104页,编辑于2022年,星期二应用举例应用举例n测两个甘薯品种单株平均产量,其中第一个品种测了测两个甘薯品种单株平均产量,其中第一个品种测了332株,株,=1550g,s1=5.350g;第二个品种测了;第二个品种测了282株,株,=1250g,s2=3.750g。试估计这两个品种单。试估计这两个品种单株平均产量的相差在株平均产量的相差在95%置信度下的置信区间。置信度下的置信区间。第17页,共104页,编辑于2022年,星期二n由附表
12、由附表3查得置信度为查得置信度为95%时,时,u0.05=1.96,并且,并且n95%置信度下的置信区间为置信度下的置信区间为n(1512)1.960.3612(1512)1.960.36,即即2.2912 3.71。因此,第一个品种比第二个品种的。因此,第一个品种比第二个品种的单株平均产量多单株平均产量多2.29 50g3.7150g,这个估计有,这个估计有95%的的把握。把握。第18页,共104页,编辑于2022年,星期二(2)两总体方差未知且为小样本两总体方差未知且为小样本时时 如果如果两总体方差相等两总体方差相等,即,即1222 2。12在在1置信度下的置信区间为:置信度下的置信区间为
13、:其中,其中,df=n1+n2-2第19页,共104页,编辑于2022年,星期二应用举例应用举例n比较两种密度水稻的平均亩产量,每种密度各调比较两种密度水稻的平均亩产量,每种密度各调查查5个小区,结果个小区,结果 =428kg,=440kg,=11.136kg。试估计这两种密度水稻的平均。试估计这两种密度水稻的平均亩产量差数在亩产量差数在99%置信度下的置信区间。置信度下的置信区间。第20页,共104页,编辑于2022年,星期二n由附表由附表5查得查得df8时置信度为时置信度为99%时,时,t0.013.355n99%置信度下的置信区间为置信度下的置信区间为(428440)3.355 11.1
14、3612(428440)3.35511.136,即,即49.41225.4。n结果说明:第一种密度的平均亩产量可以比第二种密度少结果说明:第一种密度的平均亩产量可以比第二种密度少收收49.4kg到多收到多收25.4kg,波动很大。,波动很大。n因此,这个例子说明因此,这个例子说明12的。的。第21页,共104页,编辑于2022年,星期二n当当 12时,意味着两总体平均数相等,因此,可用两时,意味着两总体平均数相等,因此,可用两样本平均数的加权平均数样本平均数的加权平均数 作为对作为对的估计:的估计:第22页,共104页,编辑于2022年,星期二 如果如果两总体方差不相等两总体方差不相等,即,即
15、1222。12在在1置信度下的置信区间为:置信度下的置信区间为:其中其中 取其整数部分取其整数部分第23页,共104页,编辑于2022年,星期二第二节第二节 统计假设测验的原理统计假设测验的原理一、统计假设测验的概念一、统计假设测验的概念二、统计假设测验的原理二、统计假设测验的原理 三、统计假设测验的步骤三、统计假设测验的步骤 四、两尾测验和一尾测验四、两尾测验和一尾测验 第24页,共104页,编辑于2022年,星期二一、统计假设测验的概念一、统计假设测验的概念(1)为什么要进行统计假设测验)为什么要进行统计假设测验n一个试验相当于一个样本,由一个样本统计数可以对总一个试验相当于一个样本,由一
16、个样本统计数可以对总体参数作出估计,但总体参数是固定的,而样本统计数体参数作出估计,但总体参数是固定的,而样本统计数会因样本不同而不同,即样本统计数存在误差。会因样本不同而不同,即样本统计数存在误差。第25页,共104页,编辑于2022年,星期二n如:某地区主栽水稻品种的亩产量为如:某地区主栽水稻品种的亩产量为550kg(总体),一新(总体),一新品种的多点试验结果为品种的多点试验结果为600kg的亩产量,试问这一新品种的的亩产量,试问这一新品种的亩产量是否真正高于主栽品种?(其它举例见教材亩产量是否真正高于主栽品种?(其它举例见教材P75)n该新品种的亩产量比主栽品种高该新品种的亩产量比主栽
17、品种高600550=50kg,这是试验,这是试验的表面效应,造成这种差异的可能原因有两个:的表面效应,造成这种差异的可能原因有两个:q一是新品种确实优于主栽品种一是新品种确实优于主栽品种q二是试验误差二是试验误差第26页,共104页,编辑于2022年,星期二(2)如何进行假设测验)如何进行假设测验n那么如何判断是哪一种原因?方法是将表面效应与误差作比那么如何判断是哪一种原因?方法是将表面效应与误差作比较。较。q如果表面效应并不大于误差,则无充分证据说明新品种确实优于主栽品如果表面效应并不大于误差,则无充分证据说明新品种确实优于主栽品种,表面效应是由试验误差造成的。种,表面效应是由试验误差造成的
18、。q如果表面效应大于误差,表面效应不完全是由试验误差造成的,说如果表面效应大于误差,表面效应不完全是由试验误差造成的,说明新品种确实优于主栽品种。明新品种确实优于主栽品种。第27页,共104页,编辑于2022年,星期二n表面效应是否大于试验误差这个度怎么把握?表面效应是否大于试验误差这个度怎么把握?q我们可以根据抽样误差出现的概率而利用抽样分布来计算。我们可以根据抽样误差出现的概率而利用抽样分布来计算。q只要设定一定的概率标准,如只要设定一定的概率标准,如5%或或1%,如果表面效应属于误差的概率,如果表面效应属于误差的概率不超过这个标准,我们就可以认为表面效应不完全是由试验误差造成不超过这个标
19、准,我们就可以认为表面效应不完全是由试验误差造成的。的。第28页,共104页,编辑于2022年,星期二(3)相关概念)相关概念n统计推断统计推断:把试验的表面效应与误差大小相比较并由表:把试验的表面效应与误差大小相比较并由表面效应可能属于误差的概率而作出推论的方法。面效应可能属于误差的概率而作出推论的方法。n统计假设测验:统计假设测验:计算表面效应由误差造成的概率首先必须假计算表面效应由误差造成的概率首先必须假设表面效应是由误差造成的(如假定新品种并不优于主栽品设表面效应是由误差造成的(如假定新品种并不优于主栽品种)。有了这个事先的假设,才能计算概率。种)。有了这个事先的假设,才能计算概率。这
20、种先作处理这种先作处理无效的假设(无效假设)再依据该假设概率大小来判断接受或无效的假设(无效假设)再依据该假设概率大小来判断接受或否定该假设的过程称为统计假设测验否定该假设的过程称为统计假设测验。第29页,共104页,编辑于2022年,星期二二、统计假设测验的原理二、统计假设测验的原理(1)两个总体间的差异如何比较?)两个总体间的差异如何比较?q一种方法是检验整个总体材料,获得全部结果,这种一种方法是检验整个总体材料,获得全部结果,这种方法很准确,但实际上不可能进行。方法很准确,但实际上不可能进行。q另一种方法是通过研究样本来研究其所代表的总体。另一种方法是通过研究样本来研究其所代表的总体。n
21、如将新旧品种共同种植如将新旧品种共同种植12年,取得其平均产量,然后由此年,取得其平均产量,然后由此推断推断“新旧品种无差异新旧品种无差异”的假设是否正确。如果发现假设和的假设是否正确。如果发现假设和试验结果相符的可能性大,接受该假设;反之,否定该假设。试验结果相符的可能性大,接受该假设;反之,否定该假设。第30页,共104页,编辑于2022年,星期二(2)相关概念)相关概念 n统计假设统计假设:要进行统计假设测验,首先需要提出一个有关某一:要进行统计假设测验,首先需要提出一个有关某一总体参数的假设,这种假设称为统计假设。总体参数的假设,这种假设称为统计假设。n无效假设无效假设:统计假设一般假
22、设没有效应差异,即表面效应是由误差:统计假设一般假设没有效应差异,即表面效应是由误差造成的,这种假设称为无效假设,记作造成的,这种假设称为无效假设,记作H0。n备择假设备择假设:和无效假设相对应的是备择假设,记作:和无效假设相对应的是备择假设,记作HA。q如果否定了无效假设,就必须接受备择假设;如果接受了无效假设,如果否定了无效假设,就必须接受备择假设;如果接受了无效假设,也就否定了备择假设。也就否定了备择假设。第31页,共104页,编辑于2022年,星期二(3)常见的统计假设类型)常见的统计假设类型n单个平均数的假设单个平均数的假设:样本是从具有平均数:样本是从具有平均数0的总体中随机抽出的
23、,的总体中随机抽出的,记作记作H0:0。q如黄瓜新品种的亩产量和主栽品种相同,这是指新品种的产量是主栽品种产量如黄瓜新品种的亩产量和主栽品种相同,这是指新品种的产量是主栽品种产量的一个随机样本,其平均产量的一个随机样本,其平均产量等于主栽品种产量等于主栽品种产量0,故记为,故记为H0:0。n两个平均数相比较的假设两个平均数相比较的假设:两个样本是从两个具有相等平均:两个样本是从两个具有相等平均数的总体中随机抽出的,记为数的总体中随机抽出的,记为H0:12或或120。q如两个番茄品种亩产量相同或两种杀虫剂对于某种害虫的药效相等。如两个番茄品种亩产量相同或两种杀虫剂对于某种害虫的药效相等。第32页
24、,共104页,编辑于2022年,星期二三、统计假设测验的步骤三、统计假设测验的步骤(1)对所研究的总体及所抽取的样本首先提出一个无效假设和)对所研究的总体及所抽取的样本首先提出一个无效假设和备择假设备择假设(2)在承认上述无效假设的前提下,获得平均数的抽样分布,)在承认上述无效假设的前提下,获得平均数的抽样分布,计算该假设正确的概率计算该假设正确的概率(3)根据)根据“小概率事件实际上不可能发生小概率事件实际上不可能发生”原理接受或否定原理接受或否定假设假设第33页,共104页,编辑于2022年,星期二应用实例n某地小麦主栽品种亩产某地小麦主栽品种亩产300kg,即当地品种这个总体,即当地品种
25、这个总体的平均数的平均数0=300kg,并从多年种植结果获得其标准差,并从多年种植结果获得其标准差=75kg,而现有某新品种通过,而现有某新品种通过25个小区的试验,计个小区的试验,计得其样本平均亩产量为得其样本平均亩产量为330kg,即即 =330,那么新品种样,那么新品种样本所属总体与本所属总体与0=300kg的主栽品种这个总体是否有显著的主栽品种这个总体是否有显著差异呢?差异呢?第34页,共104页,编辑于2022年,星期二(1)对所研究的总体首先提出一个无效假设)对所研究的总体首先提出一个无效假设n通常无效假设常为所比较的两个总体间无差异。通常无效假设常为所比较的两个总体间无差异。n测
26、验单个平均数,则假设该样本是从一已知总体中随机抽出的,即测验单个平均数,则假设该样本是从一已知总体中随机抽出的,即H0:0,备择假设为,备择假设为HA:0。q假定新品种的总体平均数假定新品种的总体平均数等于原品种的总体平均数等于原品种的总体平均数0=300kg,而样本平,而样本平均数和之间的差数:均数和之间的差数:330300=30kg属随机误差;属随机误差;n如果测验两个平均数,则假设两个样本的总体平均数相等,如果测验两个平均数,则假设两个样本的总体平均数相等,即即H0:12,也就是假设两个样本平均数的差数,也就是假设两个样本平均数的差数 属随机误差,并非真实差异;其备择假设为属随机误差,并
27、非真实差异;其备择假设为HA:1 2。第35页,共104页,编辑于2022年,星期二(2)在承认上述无效假设的前提下,获得平均)在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率数的抽样分布,计算假设正确的概率 n先承认无效假设,从已知总体中抽取样本容量先承认无效假设,从已知总体中抽取样本容量为为n=25的样本,根据中心极限定理,该样本平的样本,根据中心极限定理,该样本平均数的抽样分布服从正态分布,平均数均数的抽样分布服从正态分布,平均数 =300kg,标准误,标准误 =15(kg)。第36页,共104页,编辑于2022年,星期二 计算概率计算概率 n在假设在假设H0为正确的
28、条件下,根据的抽样分布算出获得为正确的条件下,根据的抽样分布算出获得 =330kg的概率。的概率。n将将 标准化:标准化:n新品种产量有可能高于或低于主栽品种,用两尾概率。新品种产量有可能高于或低于主栽品种,用两尾概率。n查附表查附表2,当,当u2时,时,P=0.0455,这说明,这说明 030kg属于随属于随机误差的概率小于机误差的概率小于5%,即新品种总体与主栽品种总体没,即新品种总体与主栽品种总体没有差异的概率小于有差异的概率小于5%。第37页,共104页,编辑于2022年,星期二n这样有两种推论可以选择:这样有两种推论可以选择:qA.新品种与主栽品种无明显差异,其概率小于新品种与主栽品
29、种无明显差异,其概率小于5%。qB.新品种与主栽品种有明显差异,其概率大于新品种与主栽品种有明显差异,其概率大于95%。n那么我们是选择哪一种推论呢?那么我们是选择哪一种推论呢?第38页,共104页,编辑于2022年,星期二 计算接受区和否定区计算接受区和否定区n在假设在假设H0为正确的条件下,根据为正确的条件下,根据 的抽样分布划出一个区的抽样分布划出一个区间,如间,如 在这一区间内则接受在这一区间内则接受H0,如,如 在这一区间外则否在这一区间外则否定定H0。n意思就是,如果意思就是,如果 在这个区间内,该差数就解释为随机误在这个区间内,该差数就解释为随机误差;如果差;如果 落在这个区间外
30、,该差数就应该就解释为真实落在这个区间外,该差数就应该就解释为真实差异。差异。n如何确定这一区间呢?如何确定这一区间呢?第39页,共104页,编辑于2022年,星期二n我们在讲正态分布的时候,知道:我们在讲正态分布的时候,知道:n在在 的抽样分布中,落在的抽样分布中,落在(,)区间内)区间内的有的有95%,落在这一区间外,落在这一区间外(即即 和和 )的概率只有的概率只有5%。n如果以如果以5%概率作为接受或否定概率作为接受或否定H0的界限,那么前者称为的界限,那么前者称为接受假设的区域,简称接受区;后者为否定假设的区域,接受假设的区域,简称接受区;后者为否定假设的区域,简称否定区。简称否定区
31、。q 1%概率的接受区和否定区各是多少?概率的接受区和否定区各是多少?第40页,共104页,编辑于2022年,星期二n在上面的例子中,在上面的例子中,95%的接受区域为(的接受区域为(3001.96 15,3001.9615),即(),即(270.6,329.4)。)。第41页,共104页,编辑于2022年,星期二(3)根据根据“小概率事件实际上不可能发生小概率事件实际上不可能发生”原原理接受或否定无效假设理接受或否定无效假设n根据根据“小概率事件实际上不可能发生小概率事件实际上不可能发生”原理,原理,当无效假设成立的概率小于当无效假设成立的概率小于5%或或1%时,我们时,我们就认为无效假设不
32、可能成立,从而否定无效假就认为无效假设不可能成立,从而否定无效假设,接受备择假设。设,接受备择假设。第42页,共104页,编辑于2022年,星期二n上例中,上例中,30kg是由随机误差造成的概率小于是由随机误差造成的概率小于5%,因,因此可以否定此可以否定H0,称这个差数是显著的,接受,称这个差数是显著的,接受HA。q如果差数由随机误差造成的概率小于如果差数由随机误差造成的概率小于1%,就称这个差数是极显著的,就称这个差数是极显著的,接受接受HA。n用来测验假设的概率标准用来测验假设的概率标准5%或或1%等,称为显著水平,一等,称为显著水平,一般用般用表示,如表示,如0.05或或0.01。n上
33、例中算得上例中算得u值的概率小于值的概率小于5%,说明差数,说明差数30kg已经达到已经达到0.05显著水平。显著水平。第43页,共104页,编辑于2022年,星期二统计假设测验的步骤可总结如下:统计假设测验的步骤可总结如下:(1)对样本所属的总体提出统计假设,包括无效假设和备择假)对样本所属的总体提出统计假设,包括无效假设和备择假设。设。(2)规定测验的显著水平)规定测验的显著水平值。值。(3)在无效假设为正确的假定下,根据统计数的抽样分布,)在无效假设为正确的假定下,根据统计数的抽样分布,如为正态分布的计算正态离差如为正态分布的计算正态离差u值,或根据显著水平划出否值,或根据显著水平划出否
34、定区域。定区域。(4)将显著水平和)将显著水平和u值比较,或将试验结果和否定区域比较,值比较,或将试验结果和否定区域比较,作出接受或否定无效假设的推断。作出接受或否定无效假设的推断。第44页,共104页,编辑于2022年,星期二四、两尾测验和一尾测验四、两尾测验和一尾测验n我们在提出统计假设时,必有一个相对应的备择假设。我们在提出统计假设时,必有一个相对应的备择假设。备择假设是否定无效假设时必然要接受的假设。备择假设是否定无效假设时必然要接受的假设。n如果如果H0:0,备择假设为,备择假设为HA:0。n后者包括两种可能性,即后者包括两种可能性,即0和和0。因而在假设测验。因而在假设测验时所考虑
35、的概率为正态曲线左边一尾概率和右边一尾的时所考虑的概率为正态曲线左边一尾概率和右边一尾的总和,这类测验称为两尾测验,它具有两个否定区域。总和,这类测验称为两尾测验,它具有两个否定区域。第45页,共104页,编辑于2022年,星期二n如果如果H0:0,备择假设为,备择假设为HA:0。q某种杀虫剂防虫效果达到某种杀虫剂防虫效果达到90%才符合标准,那么其无效假才符合标准,那么其无效假设为设为H0:90%,备择假设为,备择假设为HA:90%。n对应的备择假设只有一种可能,无效假设只有一个否定区域,对应的备择假设只有一种可能,无效假设只有一个否定区域,即正态曲线的右边一尾。这类测验称一尾测验。即正态曲
36、线的右边一尾。这类测验称一尾测验。n一尾测验还有一种情况,即一尾测验还有一种情况,即H0:0,HA:0,这时,这时,否定区域在正态曲线的左边一尾。否定区域在正态曲线的左边一尾。q使用某种杀菌剂后的发病率为使用某种杀菌剂后的发病率为10%,不使用时为,不使用时为50%,试测验,试测验该杀菌剂是否降低了发病率。那么该杀菌剂是否降低了发病率。那么H0:50%,HA:50%。第46页,共104页,编辑于2022年,星期二n作一尾测验时,需将附表作一尾测验时,需将附表3列出的两尾概率乘列出的两尾概率乘以以1/2,再查出其,再查出其u值。如作值。如作0.05时的一尾测时的一尾测验,查附表的验,查附表的P0
37、.10一栏,一栏,u1.64,其否定,其否定区域为区域为 或或 。n当当0.05时,两尾测验的时,两尾测验的|u|1.96,而一尾,而一尾测验的测验的u1.64或或u1.64。n所以,所以,一尾测验容易否定假设一尾测验容易否定假设。在试验之前应。在试验之前应慎重考虑采用一尾测验还是两尾测验。慎重考虑采用一尾测验还是两尾测验。第47页,共104页,编辑于2022年,星期二第48页,共104页,编辑于2022年,星期二第三节第三节 样本平均数的显著性测验样本平均数的显著性测验一、样本平均数显著性测验的类型一、样本平均数显著性测验的类型 二、单个样本平均数的假设测验二、单个样本平均数的假设测验三、两
38、个样本平均数相比较的假设测验三、两个样本平均数相比较的假设测验四、二项资料百分数(成数)的假设测验四、二项资料百分数(成数)的假设测验第49页,共104页,编辑于2022年,星期二一、样本平均数显著性测验的类型一、样本平均数显著性测验的类型n根据总体方差根据总体方差2是否已知和样本大小可分为以下几种测验。是否已知和样本大小可分为以下几种测验。qu测验测验:适用于总体方差已知或总体方差虽未知但:适用于总体方差已知或总体方差虽未知但为大样本的情况为大样本的情况qt测验测验:适用于总体方差未知且为小样本的情况:适用于总体方差未知且为小样本的情况第50页,共104页,编辑于2022年,星期二(1)u
39、测验测验n根据中心极限定理,从一个平均数为根据中心极限定理,从一个平均数为、方差为、方差为2的正态总体的正态总体中抽样,或者在一个非正态总体里抽样,只要样本容量足够大中抽样,或者在一个非正态总体里抽样,只要样本容量足够大,所得一系列样本平均数,所得一系列样本平均数 的分布必然趋向正态分布,即的分布必然趋向正态分布,即 。经。经 标准化后,服从标准正态分布标准化后,服从标准正态分布N(0,1)。)。n由试验结果计算出由试验结果计算出u值后,便可从附表值后,便可从附表3查出其相应的概率,测验查出其相应的概率,测验H0:0。n这类测验称为这类测验称为u测验。测验。第51页,共104页,编辑于2022
40、年,星期二应用举例应用举例n如:苹果某品种的果实硬度如:苹果某品种的果实硬度015kg/cm2,进行喷,进行喷Ca2+处处理后,取理后,取100个果实,个果实,15.6kg/cm2,s0.5kg/cm2。问。问Ca2+处理能否提高苹果果实硬度?处理能否提高苹果果实硬度?第52页,共104页,编辑于2022年,星期二n提出假设:提出假设:H0:0,HA:0。n规定显著水平:规定显著水平:0.05,u0.05=1.64。n统计量计算:统计量计算:n作出推断:作出推断:uu0.05,P0.05,否定,否定H0,接受,接受HA。n解释试验结果:解释试验结果:Ca2+处理能显著提高苹果果实硬度。处理能显
41、著提高苹果果实硬度。第53页,共104页,编辑于2022年,星期二(2)t 测验测验n当总体标准差当总体标准差未知且为小样本时,以样本标准未知且为小样本时,以样本标准差差s代替代替所得到的统计数记为所得到的统计数记为t,。nt变量不再服从标准正态分布,而是服从自由度变量不再服从标准正态分布,而是服从自由度dfn1的的t分布。分布。n按按t分布进行的假设测验称为分布进行的假设测验称为t测验。测验。nt测验的原理、步骤均同测验的原理、步骤均同u测验。测验。第54页,共104页,编辑于2022年,星期二应用举例应用举例n如:池塘水含氧量的标准是如:池塘水含氧量的标准是0 4.5 mL/L,现,现对某
42、一池塘水进行含氧量检测,取对某一池塘水进行含氧量检测,取10个点,含个点,含氧量分别为氧量分别为4.33、4.52、4.25、4.44、4.56、4.54、4.42、4.26、4.24和和4.50 mL/L。问该池。问该池塘的水含氧量是否达到标准?塘的水含氧量是否达到标准?第55页,共104页,编辑于2022年,星期二n提出假设:提出假设:H0:0,HA:0。n规定显著水平:规定显著水平:0.05,t0.05(9)=2.262。n统计量计算:统计量计算:q =4.406,s0.126 n作出推断:作出推断:|t|t0.05(9),P0.05,否定,否定H0,接受,接受HA。n解释试验结果:此池
43、塘的水含氧量没有达到标准。解释试验结果:此池塘的水含氧量没有达到标准。第56页,共104页,编辑于2022年,星期二二、单个样本平均数的假设测验二、单个样本平均数的假设测验n这是测验某一样本平均数所属总体是否和某一指定总体的平均这是测验某一样本平均数所属总体是否和某一指定总体的平均数相同。上面的举例都属于单个样本平均数的假设测验。数相同。上面的举例都属于单个样本平均数的假设测验。n如:某春小麦良种的千粒重如:某春小麦良种的千粒重034g,现自外地引入一高产,现自外地引入一高产品种,在品种,在8个小区种植,得其千粒重为:个小区种植,得其千粒重为:35.6、37.6、33.4、35.1、32.7、
44、36.8、35.9、34.6g,问新引入品种的千粒重与当,问新引入品种的千粒重与当地良种有无显著差异?地良种有无显著差异?第57页,共104页,编辑于2022年,星期二n提出假设:提出假设:H0:0,HA:0。n规定显著水平:规定显著水平:0.05,t0.05(7)=2.365。n统计量计算:统计量计算:q =35.2g,s1.64g n作出推断:作出推断:t t0.05(9),P 0.05,接受,接受H0,否定,否定HA。n推断:新引入品种千粒重与当地良种千粒重指定值没有显著差异。推断:新引入品种千粒重与当地良种千粒重指定值没有显著差异。第58页,共104页,编辑于2022年,星期二三、两个
45、样本平均数相比较的假设测验三、两个样本平均数相比较的假设测验n这是由两个样本平均数的相差,测验这两个样这是由两个样本平均数的相差,测验这两个样本所属的总体平均数有无明显差异。本所属的总体平均数有无明显差异。q两个黄瓜品种的产量是否相同。两个黄瓜品种的产量是否相同。q两种杀虫药剂对于辣椒疫病的防治效果是否相等。两种杀虫药剂对于辣椒疫病的防治效果是否相等。n测验方法因试验设计的不同以下两种:测验方法因试验设计的不同以下两种:q(1)成组数据的平均数比较)成组数据的平均数比较q(2)成对数据的平均数比较)成对数据的平均数比较 第59页,共104页,编辑于2022年,星期二(1)成组数据的平均数比较)
46、成组数据的平均数比较n成组数据:成组数据:如果两个处理为完全随机设计,各供试单位彼此如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据都称为独立,不论两个处理的样本容量是否相同,所得数据都称为成成组数据组数据。以。以组(处理)平均数组(处理)平均数作为相互比较的标准。作为相互比较的标准。n根据两个样本所属总体的根据两个样本所属总体的方差(方差(12和和22)是否已知、是否)是否已知、是否相等相等而采用不同的测验方法。而采用不同的测验方法。第60页,共104页,编辑于2022年,星期二 两个样本的总体方差两个样本的总体方差12和和22 已知已知n由抽样分布的
47、公式知,两样本平均数由抽样分布的公式知,两样本平均数 和和 的差数标准误的差数标准误 ,在在12和和22是已知时为:是已知时为:n并有:并有:n在假设在假设H0:1 2 下,下,n故可对两样本平均数的差异作出假设测验。故可对两样本平均数的差异作出假设测验。第61页,共104页,编辑于2022年,星期二应用举例应用举例n某小麦品种产量的某小麦品种产量的20.4(kg/m2)2。在该品种的一块地上用。在该品种的一块地上用A、B两种方法取样。两种方法取样。A法取法取12个点,产量为个点,产量为 1.2(kg/m2)2;B法法8个点,产量为个点,产量为 1.4(kg/m2)2。问。问A、B两种取样方两
48、种取样方法的产量有无明显差异?法的产量有无明显差异?第62页,共104页,编辑于2022年,星期二nH0:12,HA:12。n显著水平取显著水平取0.05,u0.05=1.96。n计算计算u值值 12=2220.4,n1=12,n2=8,n作出推断:作出推断:|u|u0.05,P0.05,接受,接受H0,否定,否定HA。n说明:这两种取样方法的产量无明显差异。说明:这两种取样方法的产量无明显差异。第63页,共104页,编辑于2022年,星期二 两个样本的总体方差两个样本的总体方差12和和22 未知,但可假定未知,但可假定12=222,且两个样本为小样本时,且两个样本为小样本时,采用,采用t测验
49、测验 n根据样本方差计算平均数差数的合并方差根据样本方差计算平均数差数的合并方差se2,作为对,作为对2的估计。由的估计。由于假定于假定12=222,se2应为两个样本方差的加权平均值。应为两个样本方差的加权平均值。n并有:并有:n在假设在假设H0:1 2 下,下,n故可对两样本平均数的差异作出假设测验,其故可对两样本平均数的差异作出假设测验,其df=df1+df2=n1+n2-2。第64页,共104页,编辑于2022年,星期二应用举例应用举例n调查某农场调查某农场30万苗万苗/亩和亩和35万苗万苗/亩的亩产量(亩的亩产量(kg),),各调查各调查5个田块(右表)。个田块(右表)。n问两种栽培
50、密度的亩产量问两种栽培密度的亩产量有无明显差异。有无明显差异。x1(30万苗万苗)x2(35万苗万苗)400450420440435445460445425420第65页,共104页,编辑于2022年,星期二n因为是小样本,所以用因为是小样本,所以用t测验。又由于不知道两种密度测验。又由于不知道两种密度的亩产量谁高谁低,所以用两尾测验。的亩产量谁高谁低,所以用两尾测验。nH0:12,HA:12。n显著水平取显著水平取0.05,t0.05(8)=2.306。x1x1430(x1430)2x2x2440(x2440)24003090045010100420101004400043552544552