《均数差异显著性检验精选PPT.ppt》由会员分享,可在线阅读,更多相关《均数差异显著性检验精选PPT.ppt(77页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于均数差异关于均数差异显著著性性检验第1页,讲稿共77张,创作于星期日事物的一部分(样本)事物的全部(总体)推断推断统计量参数第一节第一节 概率及分布概率概率及分布概率第2页,讲稿共77张,创作于星期日一、事件与概率一、事件与概率(一)随机事件必然事件:在一定条件下必然后发生。不可能事件:在一定条件下必然不会发生的事件。随机事件:在一定条件下,可能发生也可能不发生。第3页,讲稿共77张,创作于星期日(二)事件的概率(二)事件的概率事件的概率:指该事件发生可能性的大小,出现的机会多少事件的概率:指该事件发生可能性的大小,出现的机会多少。事件事件A的概率记为的概率记为P(A)。)。研究随机事件,
2、仅知道可能发生哪些随机事件是不够的,还需研究随机事件,仅知道可能发生哪些随机事件是不够的,还需了解各种随机事件发生的可能性大小,以揭示这些事件的内在了解各种随机事件发生的可能性大小,以揭示这些事件的内在的统计规律性,从而指导实践。这就要求有一个能够的统计规律性,从而指导实践。这就要求有一个能够刻划事件发刻划事件发生可能性大小的数量指标生可能性大小的数量指标,这指标应该是事件本身所固有的,这指标应该是事件本身所固有的,且不随人的主观意志而改变,人们且不随人的主观意志而改变,人们称之为概率(称之为概率(probability)。)。第4页,讲稿共77张,创作于星期日 概率的统计定义概率的统计定义
3、在相同条件下进行在相同条件下进行n次重复次重复试验,如果随机事件试验,如果随机事件A发生的次数为发生的次数为m,那么,那么m/n称为随机事件称为随机事件A的的频率频率(frequency);当试验重);当试验重复数复数n逐渐增大时,随机事件逐渐增大时,随机事件A的频率越来越稳定的频率越来越稳定地接近某一数值地接近某一数值 p,那么那么 就就 把把 p称为随机事件称为随机事件A的的概率概率。第5页,讲稿共77张,创作于星期日 表表41 抛掷一枚硬币发生正面朝上的试验记录抛掷一枚硬币发生正面朝上的试验记录 第6页,讲稿共77张,创作于星期日 从表从表4-1可看出,随着实验次数的增多,正可看出,随着
4、实验次数的增多,正面朝上这个事件发生的频率越来越稳定地接近面朝上这个事件发生的频率越来越稳定地接近0.5,我们就把,我们就把0.5作为这个事件的概率。作为这个事件的概率。在一般情况下,随机事件的概率在一般情况下,随机事件的概率p是不可能是不可能准确得到的。通常以试验次数准确得到的。通常以试验次数n充分大时随机事充分大时随机事件件A的频率作为该随机事件概率的近似值。的频率作为该随机事件概率的近似值。即即 P(A)=pm/n (n充分大)充分大)(4-1)第7页,讲稿共77张,创作于星期日概率的性质概率的性质 1、对于任何事件、对于任何事件A,有,有0P(A)1;2、必然事件的概率为、必然事件的概
5、率为1,即,即P()=1;3、不可能事件的概率为、不可能事件的概率为0,即,即P()=0。第8页,讲稿共77张,创作于星期日 随机事件的概率表示了随机事件在一次试验中随机事件的概率表示了随机事件在一次试验中出现的可能性大小。若随机事件的概率很小,出现的可能性大小。若随机事件的概率很小,例如小于例如小于0.05、0.01、0.001,称之为,称之为小概率事件小概率事件。二、小概率事件实际不可能性原理二、小概率事件实际不可能性原理第9页,讲稿共77张,创作于星期日 小概率事件虽然不是不可能事件,但在一次小概率事件虽然不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很试验中出现的可能性
6、很小,不出现的可能性很 大大,以,以 至于实际上可以看成是不可能发生的。至于实际上可以看成是不可能发生的。在统计学上,在统计学上,把小概率事件在一次试验中看成把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理不可能性原理,亦称为小概率原理。小概率事。小概率事件实际不可能性原理是统计学上进行假设检验件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。(显著性检验)的基本依据。第10页,讲稿共77张,创作于星期日三、概率的分布三、概率的分布(一)随机变量表示随机试验结果的一个变量。离散型随机变量:
7、雄性动物的头数、鸡的产蛋数、兽医门诊病畜连续型随机变量:家畜的体长、体重第11页,讲稿共77张,创作于星期日研究一个随机变量主要就是研究它的取值规律,即取值概率。随机变量取哪些值及取这些值的概率之间的对应关系叫做随机变量的概率分布。126头基础母羊的体重资料 单位:kg第12页,讲稿共77张,创作于星期日组中值次数频率37.510.00793740.510.00793743.560.04761946.5180.14285749.5260.20634952.5270.21428655.5260.20634958.5120.09523861.570.05555664.520.015873频率分布图
8、频率分布图第13页,讲稿共77张,创作于星期日可以设想可以设想可以设想可以设想 ,如果样本取得越来越大,如果样本取得越来越大,如果样本取得越来越大,如果样本取得越来越大(n n+)+),组分得越,组分得越,组分得越,组分得越来越细来越细来越细来越细(i i0)0),某一范围内的频率将趋近于一个稳定值,某一范围内的频率将趋近于一个稳定值,某一范围内的频率将趋近于一个稳定值,某一范围内的频率将趋近于一个稳定值 概率。这时概率。这时概率。这时概率。这时 ,频率分布直方图各个直方上端中点频率分布直方图各个直方上端中点频率分布直方图各个直方上端中点频率分布直方图各个直方上端中点的联线的联线的联线的联线
9、频率分布折线将逐渐趋向于一条曲线,换频率分布折线将逐渐趋向于一条曲线,换频率分布折线将逐渐趋向于一条曲线,换频率分布折线将逐渐趋向于一条曲线,换句话说,当句话说,当句话说,当句话说,当n n+、i i00时,时,时,时,频率分布折线频率分布折线频率分布折线频率分布折线:基础母羊的体重平均数;基础母羊的体重平均数;基础母羊的体重平均数;基础母羊的体重平均数;:基础母羊的体重标准差。:基础母羊的体重标准差。:基础母羊的体重标准差。:基础母羊的体重标准差。第14页,讲稿共77张,创作于星期日(二)正态分布(二)正态分布正态分布是连续型随机变量的概率分布,家畜的体重,体长,体高,血糖含量,血红蛋白含量
10、等。试验误差一般也服从这种分布。第15页,讲稿共77张,创作于星期日1、正态分布的意义:、正态分布的意义:如果连续型随机变量x服从总体均数、总体方差为2的正态分布,则将其记作 xN(,2)曲线关于x=对称,对称,的大小决定了曲线的水平位置;的大小决定了曲线的水平位置;图形程钟形,以图形程钟形,以 x为渐近线;为渐近线;当当x=时,时,取最大值;取最大值;当当大时候,曲线平坦;当大时候,曲线平坦;当小时,曲线陡峭;小时,曲线陡峭;正态分布的多数次数集中于总体均数正态分布的多数次数集中于总体均数附近,离平均数附近,离平均数越远,越远,其相应的次数越少。在其相应的次数越少。在 以上次数极少以上次数极
11、少 ;正态分布曲线在正态分布曲线在 处有拐点;处有拐点;正态分布曲线与正态分布曲线与x轴围成的面积等于轴围成的面积等于1。第16页,讲稿共77张,创作于星期日 统计篇统计篇2、标准正态分布、标准正态分布=0,2=1的正态分布为标准正态分布的正态分布为标准正态分布对于任何一个服从正态分布对于任何一个服从正态分布对于任何一个服从正态分布对于任何一个服从正态分布N N(,(,2 2)的随机变量的随机变量的随机变量的随机变量x x,都,都,都,都可以通过标准化变换:可以通过标准化变换:可以通过标准化变换:可以通过标准化变换:U=U=(x-x-)将将将将 其变换为服从标准正态分布的随机变量其变换为服从标
12、准正态分布的随机变量其变换为服从标准正态分布的随机变量其变换为服从标准正态分布的随机变量U U。U U 称称称称 为为为为 标标标标 准准准准 正正正正 态变量或标准正态离差态变量或标准正态离差态变量或标准正态离差态变量或标准正态离差(standard normal deviate)(standard normal deviate)。U UN N(0(0,1)1)第17页,讲稿共77张,创作于星期日标准正态分布表:附表1-1.给定的概率值P(x30时,t分布曲线就比较接近标准正态分布曲线;df时则和标准正态分布曲线重合,即t分布的极限是标准正态分布。和正态分布一样,t分布曲线与横轴所围成的面积
13、也等于1第35页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统计篇四、例题某品种鸡在放养时,500日龄平均产蛋量是156枚,现将该品种鸡改为笼养,测得16只母鸡500日龄平均产蛋量为176.53枚,标准差为32.32枚。问该品种鸡笼养时的产蛋量与放养时的产蛋量相比有没有明显变化?第第4章章 均数差异显著性检验均数差异显著性检验t检验检验1、提出假设:Ho:HA:2、计算t值3、确定临界值4、统计推断第36页,讲稿共77张,创作于星期日 统计篇统计篇2.计算统计量t第第4章章 均数差异显著性检验均数差异显著性检验t检验检验3.确定临界值第37页,讲稿共77张,创作于星期日
14、 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验4.做出判断差异显著或第38页,讲稿共77张,创作于星期日五、假设测验的两类错误五、假设测验的两类错误表5.1假设测验的两类错误测验结果测验结果如果如果H0是正确的是正确的如果如果H0是错误的是错误的H0被否定被否定 第一类错误第一类错误 没有错误没有错误H0被接受被接受 没有错误没有错误 第二类错误第二类错误 第一类错误的概率为显著水平第一类错误的概率为显著水平 值。值。第二类错误的概率为第二类错误的概率为 值。值。值的计算方法就是计算抽样值的计算方法就是计算抽样平均数落在已知总体的接受区的概率(这里的已知总体是假平均数
15、落在已知总体的接受区的概率(这里的已知总体是假定的)。定的)。第39页,讲稿共77张,创作于星期日 (1)在样本容量在样本容量n固定的条件下,提高显著水平固定的条件下,提高显著水平 (取较小的值取较小的值),如从,如从5%变为变为1%则将增大第二类错误的概率则将增大第二类错误的概率 值。值。(2)在在n和显著水平和显著水平 相同的条件下,真总体平均数相同的条件下,真总体平均数 和假设平均数和假设平均数 的的相差相差(以标准误为单位以标准误为单位)愈大,则犯第二类错误的概率愈大,则犯第二类错误的概率 值愈小。值愈小。关于两类错误的讨论可总结如下:关于两类错误的讨论可总结如下:第40页,讲稿共77
16、张,创作于星期日 (3)为了降低犯两类错误的概率,需采用一个较低的显著水平,为了降低犯两类错误的概率,需采用一个较低的显著水平,如如 =0.05;同时适当增加样本容量,或适当减小总体方差;同时适当增加样本容量,或适当减小总体方差 ,或两者兼,或两者兼有之。有之。(4)如果显著水平如果显著水平 已固定下来,则改进试验技术和增加样本容已固定下来,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。量可以有效地降低犯第二类错误的概率。第41页,讲稿共77张,创作于星期日技能训练:P381、2第42页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统计篇二、两样本均数差异
17、显著性检验(1)配对资料比较(2)成组资料比较第三节两个两个样本均数间差异显著性检验第43页,讲稿共77张,创作于星期日(1)配对资料比较自身配对:药物使用前后高血压病人的血压变化值;两种不同检测方法对畜产品药物残留的测定结果;同质配对:具有相近条件的两个个体配成一对。第44页,讲稿共77张,创作于星期日第45页,讲稿共77张,创作于星期日 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验母猪号经产初产差数12345678910111213141.321.341.331.481.381.321.531.441.651.561.481.411.161.191.130.970
18、.961.061.271.171.241.071.081.431.371.300.951.040.190.370.370.420.110.150.290.370.570.130.110.110.210.150.03610.13690.13690.17640.01210.02250.08410.13640.32490.01690.01210.01210.04410.02253.551.1745第46页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验1.计算2.计算t3.计算自由度第47页,讲稿共77张,创作于星期
19、日 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验4.查t值表5.做出判断差异极其显著或第48页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验6.结论14头母猪经产仔猪平均初生重极其显著地高于初产仔猪平均初生重。第49页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验配对比较法的用途 1.将同胎次、同性别、体重相似的两组家畜配成对,进行试验,对观察值进行比较分析;2.将同一头家畜前后两次观察值配成一对,
20、进行 比较分析。第50页,讲稿共77张,创作于星期日技能训练:4、7第51页,讲稿共77张,创作于星期日非配对设计资料的一般形式非配对设计资料的一般形式(2)、成组比较法)、成组比较法 两样本资料之间是相互独立的。两样本资料之间是相互独立的。第52页,讲稿共77张,创作于星期日 非配对设计两样本平均数差异显著性检验的基本步骤如下:非配对设计两样本平均数差异显著性检验的基本步骤如下:1、提出无效假设与备择假设、提出无效假设与备择假设 2、计算、计算t值值 3 3、根据、根据、根据、根据df=df=(n1n1-1)-1)+(n2n2-1)-1),查临界值:,查临界值:,查临界值:,查临界值:t0.
21、05t0.05、t0.01t0.01,将,将,将,将 计计计计算所得算所得算所得算所得 t t 值的绝对值与其比较,作出统计推断值的绝对值与其比较,作出统计推断值的绝对值与其比较,作出统计推断值的绝对值与其比较,作出统计推断第53页,讲稿共77张,创作于星期日其中:其中:第54页,讲稿共77张,创作于星期日 当当 时时 第55页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验(1)组别月产蛋量(枚)x试验组292520212328262625262496273对照组20211823241921192021181
22、92434959第56页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验1.计算2.计算t第57页,讲稿共77张,创作于星期日 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验3.计算自由度4.查t值表第58页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验5.做出判断差异极其显著6.结论人工延长光照时间能极显著的提高鸡的产蛋量。第59页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统
23、计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验(2)窝别仔 猪 初 生 重(千克)平均数甲1.35、1.31、1.35、1.30、1.34、1.35、1.35、1.40、1.60、1.651.40乙1.25、1.28、1.30、1.31、1.35、1.39、1.41、1.32、1.34、1.351.33甲窝:乙窝:第60页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验1.计算2.计算t第61页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统计篇第第4章章 均数差异显著性检
24、验均数差异显著性检验t检验检验3.计算自由度4.查t值表第62页,讲稿共77张,创作于星期日北京农业职业学院北京农业职业学院 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验5.做出判断差异不显著6.结论甲窝仔猪与乙窝仔猪在平均初生重上差异不显著。第63页,讲稿共77张,创作于星期日 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验成组比较法试验误差较大成组比较法试验误差较小配对比较法试验误差最小第64页,讲稿共77张,创作于星期日技能训练3,5,6,8第65页,讲稿共77张,创作于星期日小结:小结:样本均数与总体均数差异显著性检验两样本均数差异显著
25、性检验配对资料比较成组资料比较资料的一般形式:提出假设计算t值确定临界值统计推断样本平均数计算公式:样本方差计算公式:样本标准差计算公式:第66页,讲稿共77张,创作于星期日 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验第四节第四节两个百分数资料差异显著性检验两个百分数资料差异显著性检验 某养猪场第一年饲养1125头猪,死亡58头;第二年饲养1840头,死亡70头。试检验该养猪场第二年猪的死亡率比第一年是否有明显下降?第67页,讲稿共77张,创作于星期日 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验1.计算第68页,讲稿共77张,创作于星期日
26、 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验2.计算t3.计算自由度4.查t值表第69页,讲稿共77张,创作于星期日 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验5.做出判断差异不显著6.结论该养猪场第二年猪的死亡率比第一年没有明显下降。第70页,讲稿共77张,创作于星期日 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验两个百分数资料进行两个百分数资料进行 t 检验的条件检验的条件 第71页,讲稿共77张,创作于星期日 统计篇统计篇第第4章章 均数差异显著性检验均数差异显著性检验t检验检验作业作业 某养猪场使用新药防
27、治猪白痢,试验组150头猪中有132头存活,对照组155头猪中有114头存活,试检验所用新药对防治猪白痢是否有效?第72页,讲稿共77张,创作于星期日 第五节 总体参数的区间估计 所谓参数估计就是用样本统计量来估计总所谓参数估计就是用样本统计量来估计总体参数,有体参数,有 点估计点估计(point estimation)和)和区区间估计间估计 (interval estimation)之分。之分。将样本统计量直接作为总体相应参数的估将样本统计量直接作为总体相应参数的估计值叫计值叫点估计点估计。点估计只给出了未知参数估计。点估计只给出了未知参数估计值的大小,没有考虑试验误差的影响,也没有值的大小
28、,没有考虑试验误差的影响,也没有指出估计的可靠程度。指出估计的可靠程度。第73页,讲稿共77张,创作于星期日 区间估计是在一定概率保证下指出总体参数的可能范围,区间估计是在一定概率保证下指出总体参数的可能范围,所给出的可能范围叫所给出的可能范围叫 置置 信信 区区 间(间(confidence interval),),给出的概率保证称为给出的概率保证称为 置置 信信 度度 或或 置置 信概信概 率率 (confidence probability)。)。第74页,讲稿共77张,创作于星期日设有一来自正态总体的样本,包含设有一来自正态总体的样本,包含n个观测值个观测值 ,样本平均数样本平均数 ,标准误,标准误 。总体平均数为总体平均数为。因为因为 服从自由度为服从自由度为 n-1的的 t分布。双分布。双侧概率为侧概率为a时,有:时,有:也就是说也就是说t在区间在区间 内取值的可能性为内取值的可能性为1-a,即:,即:正态总体平均数的置信区间正态总体平均数的置信区间第75页,讲稿共77张,创作于星期日变形得:变形得:总体平均数总体平均数置信度为置信度为1-a的置信区间的置信区间。第76页,讲稿共77张,创作于星期日感感谢谢大大家家观观看看第77页,讲稿共77张,创作于星期日