《第四章统计推断优秀课件.ppt》由会员分享,可在线阅读,更多相关《第四章统计推断优秀课件.ppt(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章 统计推断第1页,本讲稿共65页第一节 统计推断的意义与原理一、统计推断的意义和内容统计推断的意义和内容 统计推断,就是根据统计量的分布和概率理论,由样本统计量来推断总体的参数。统计推断包括统计假设检验和参数估计两部分内容。第2页,本讲稿共65页 统计假设检验又称显著性检验,它是根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,然后根据样本的实际结果和统计量的分布规律,通过一定的计算,作出在一定概率意义下应当接受哪种假设的方法。显著性检验的方法很多,常用的有t检验、F检验和2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。参数估计包括两个方面,一是参
2、数的点估计,二是参数的区间估计。二、统计量的抽样分布与统计推断的关系第3页,本讲稿共65页图图1 1 随机抽样和统计推断示意图随机抽样和统计推断示意图假设检验假设检验(定性定性)参数估计(定量)样本特征样本特征(统计量统计量)可知可知总体特征总体特征(参数参数)一般未知一般未知样本样本1 1样本样本2 2样本样本N N n n随机抽样随机抽样样本容量样本容量n n统计推断统计推断 总体总体(N)(N)样本样本3 3第4页,本讲稿共65页第5页,本讲稿共65页三、假设检验1假设检验的基本原理 我们结合一个实例说明统计假设检验的基本原理。例如:将20只老鼠随机分为数目相等的两组,一组作对照不注射催
3、产素,另一组注射,然后在规定的时间内测定每组各个体的血糖值。假定测定的结果对照组平均值为:=109.17,注射催产素组为:=106.88,两样本平均数并不相等,其差值(表面效应)为:=109.17-106.88=2.29,第6页,本讲稿共65页 这是否意味着注射与不注射催产素两种不同的处理,老鼠体内血糖含量一定存在有显著差异,即两相应总体血糖含量不等()呢?由于抽样的原因,两样本平均数之差(),即表面效应,或实得差异中一定包含有抽样误差造成的部分,同时也可能包含有由于处理不同造成的总体平均数不等的部分,到底后者存在与否,需要进行统计分析。计算表面效应由误差造成的概率首先必须假设表面效应是由误差
4、造成,也就是假设两样本所属总体无差异。抽样误差出现的概率可利用前面所介绍的抽样分布来计算,这里只要设定一概率标准,例如,表面效应由误差造成的概率不大于5%便可推断表面效应不大可能由误差所引起 第7页,本讲稿共65页 统计假设检验的基本原理统计假设检验的基本原理:是根据试验目的对要比较的总体提出假设,先承认待检验的假设成立,然后观察在此假设前提下样本的出现是否属于小概率事件,如果是小概率事件,则有充分的理由怀疑或否定原假设,反之则不能否定原假设。第8页,本讲稿共65页 2统计假设检验基本步骤统计假设检验基本步骤 例例:设某一肉用仔鸡常规饲养条件下50d体重的总体平均值为:=2250g,方差为:=
5、62500 g 2。从该群体中随机选择25羽初生雏鸡,在常规饲养基础上添加某种中药添加剂饲养50d,测得该样本平均值为:=2375g,问添加中药添加剂是否对仔鸡50d体重有影响?假设检验的基本步骤为:第9页,本讲稿共65页(1)根据实际需要对未知或不完全知道的总体)根据实际需要对未知或不完全知道的总体提出假设提出假设 无效假设H0:对需推知的总体参数提出的假设。(被直 接检验的假设称为原假设)备择假设HA:在拒绝无效假设后可供选择的假设。H0和HA是一对立事件,且构成完全事件系,即否定H0 就意味着接受HA,接受H0 就意味着否定HA。本例,无效假设H0为:,即用中药饲养的25羽雏鸡组成的样本
6、所属的总体平均值与指定的正常饲养情况下的总体平均值之间无实质差异。备择假设HA为:,即用中药作添加剂和不用中药作添加剂,该肉鸡种50d体重的确存在着显著差异。第10页,本讲稿共65页(2)在假定)在假定H0成立的前提下,根据统计量的抽样分布,计算实得差异成立的前提下,根据统计量的抽样分布,计算实得差异由抽样误差造成的概率。由抽样误差造成的概率。(构造合适的统计量构造合适的统计量)第11页,本讲稿共65页第12页,本讲稿共65页 在总体平均数为2250g(在H0成立下),方差为62500g2的正态总体中以样本容量为25进行抽样,抽得的一个样本平均数与总体平均数相差125g以上,由抽样误差造成的概
7、率为0.0124。第13页,本讲稿共65页(3)根据小概率事件实际不可能性原理判断是否接受)根据小概率事件实际不可能性原理判断是否接受H0 本例,在假定H0成立的前提下,经计算一个样本平均数与总体平均数相差125以上,这一事件由抽样误差造成的概率为0.0124,小于0.05,所以是一个小概率事件,根据小概率事件实际不可能性原理,可以获得如下结论:在H0成立的前提下饲喂含中药添加剂的一个样本,其平均值与没有饲喂中药添加剂的总体平均值相差125g以上不是由抽样误差所造成,的确是由饲喂中药添加剂所造成的。因此可以否定H0,接受HA。第14页,本讲稿共65页 在H0成立的前提下,根据统计量的分布,计算
8、实得差异(表面效应)由抽样误差造成的概率大于0.05,则实得差异(表面效应)由抽样误差造成的可能性较大,没有理由认为实得差异(表面效应)由两总体平均值不同而造成,检验的结果应当接受H0,两个总体平均值“差异不显著”;如果实得差异(表面效应)由抽样误差造成的概率在0.010.05之间,表示两个总体平均值“差异显著”,应否定H0,接受HA;如果其概率值小于0.01,同样否定H0,接受HA,表示两总体间存在“极显著差异”。第15页,本讲稿共65页 统计上,把否定H0的概率标准叫显著水平。用 表示,是个小概率,在生物学研究中,一般取0.05和0.01两个等级。假设检验的步骤可概括为:假设检验的步骤可概
9、括为:(1)对样本所属总体提出无效假设H0,并设立备择假设HA;(2)确定检验的显著水平 ,在假定H0成立的前提下,根据统计量的抽样分布,计算实得差异(表面效应)由抽样误差造成的概率;(3)根据这个概率与显著水平 比较的结果,由小概率事件实际不可能性原理进行差异显著性推断。(4)根据统计推断结果,结合相应的专业知识,给出一个专业的结论。第16页,本讲稿共65页3假设检验的几何学意义假设检验的几何学意义 假设检验是将统计量的分布分成两个不同的区域,一个为接受H0的区域,另一个是否定H0的区域。图图2 u分布统计假设检验的几何意义分布统计假设检验的几何意义第17页,本讲稿共65页 由标准正态分布(
10、u分布)概率计算可知,P(|)=,所以接受区域和否定区域的临界值是 和 ,统计假设检验可由样本计算的|与 比较,确定是接受还是否定H0。上例中 2.5,大于 u 0.05=1.96,所以u落在否定区域内,但又小于 u 0.01=2.58,所以实得差异由误差造成的概率在0.010.05间,“差异显著”。故否定 H0。假设检验的第二步也可以不直接计算实得差异(表面效应)由抽样误差造成的概率,而是用实得差异相对应的检验统计量的值与假设检验的临界值比较,判断差异显著性。方法如下:第18页,本讲稿共65页第19页,本讲稿共65页因此因此,假设检验步骤简写成假设检验步骤简写成:1、建立假设;2、计算检验统
11、计量;3、确定否定域(临界值),作出统计推断第20页,本讲稿共65页4两尾两尾(双侧双侧)检验和一尾检验和一尾(单侧单侧)检验检验 既考虑左边否定域又考虑右边否定域,即考虑统计量抽样分布曲线两侧(两个尾部)的检验称之为两尾检验。在生物学研究中两尾检验应用最为广泛。第21页,本讲稿共65页 在假设检验中,只有一个否定域(一侧)的假设检验叫一尾检验。即否定域在检验统计量抽样分布的一侧.第22页,本讲稿共65页 一尾检验与两尾检验的步骤相同,不同的是一尾检验将显著水平 的概率值放到一侧,而不是将其均分到左、右两侧,因此实际上采用的假设检验临界值是 和 。在相同 水平下,一尾检验否定区范围大于两尾检验
12、,所以一尾检验更易否定H0(对差异识别能力强),因此,选用一尾检验,应根据专业知识和试验目的来判断是否有充足的依据。第23页,本讲稿共65页第24页,本讲稿共65页 相伴概率:是指在原假设成立时检验统计量观测值以及所有比它更为极端的可能值出现的概率之和,用P表示。第25页,本讲稿共65页5假设检验的两类错误假设检验的两类错误第26页,本讲稿共65页第27页,本讲稿共65页第28页,本讲稿共65页第二节 对单个和两个总体平均数的假设检验一、单个平均数的假设检验 单个平均数的假设检验是检验一个样本所属的总体平均数与一个特定总体平均数0间是否存在显著差异的一种统计方法,也可理解为检验一个样本是否来自
13、某一特定总体的统计分析方法。根据统计假设检验的基本原理可知,假设检验的关键是根据统计量的分布计算实得差异(表面效应)由抽样误差造成的概率。(一)、总体方差已知时单个平均数的假设检验 当总体方差 已知时,根据样本平均数抽样分布的性质,无论样本容量是大是小,均可用u分布计算实得差异由抽样误差造成的概率,所以称u检验。第29页,本讲稿共65页 例1:测定了某品种37头犊牛100g血液中总蛋白的含量,其平均数为4.263g;该品种成年母牛100g血液中总蛋白含量为7.570g,标准差为1.001。问该品种犊牛和成年母牛血液中总蛋白含量是否存在显著差异?1、建立假设 H 0:犊牛和成年母牛间血液中总蛋白
14、含量无显著差异;HA:犊牛和成年母牛间血液中总蛋白含量存在显著差异。第30页,本讲稿共65页(二)、总体方差未知时单个平均数的假设检验 例2:某屠宰场收购了一批商品猪,一位有经验的收购人员估计这批猪的平均体重为100 kg,现随机抽测10头猪进行称重,得体重数据如下:115,98,105,95,90,110,104,108,92,118(kg),试检验此收购人员的估计是否正确?1、建立假设 H 0:这批猪的平均体重为100 kg;HA:这批猪的平均体重不等于100 kg。2、计算检验统计量第31页,本讲稿共65页 第32页,本讲稿共65页 例3:正常情况下成年男子的脉搏数为72次/min,现随
15、机检查25名慢性胃炎所至脾虚男病人的平均脉搏数为75.2次/min,标准差为6.54次/min,问此类脾虚男病人脉搏数是否显著地高于正常情况下测定的成年男子脉搏数?本例研究者的目的是推断此类脾虚男病人脉搏数是否快于正常成年男子的脉搏数=72次/min,所以应该用一尾检验。现在25名慢性胃炎所至脾虚男病人其平均脉搏数超过了正常测定值,一种可能由于抽样造成,实质此类男病人的脉搏数仍然正常或不高于 ,也有可能是由于身体内部生理等机制的共同作用,造成其显著高于 。另外由于总体的方差未知,且样本不大,故用t检验。第33页,本讲稿共65页第34页,本讲稿共65页二、两个总体平均数的比较 该类型的比较其实质
16、是检验两独立样本所属总体平均数间是否存在显著差异。即检验第一个样本的平均值 其总体平均值 与第二个样本的平均值 其总体平均值 间差异是否显著。它经常用于生物学研究中比较两种不同处理其效应的差异显著性。生物学上,通常是将一定数量的试验单位(一般为试验动物的个体)随机分成两组,其中一组接受一种处理,另一组接受另一种处理,比较它们的总体平均值。第35页,本讲稿共65页第36页,本讲稿共65页第37页,本讲稿共65页第38页,本讲稿共65页第39页,本讲稿共65页第40页,本讲稿共65页 例5:测定了31头犊牛和48头成年母牛血液中血糖的含量,得犊牛的平均血糖含量为81.23,标准差为15.64。成年
17、母牛的平均血糖含量为70.43,标准差为12.07。犊牛和成年母牛间血糖含量有无显著差异?1、建立假设2、计算检验统计量第41页,本讲稿共65页3、查表推断 实得差异由抽样误差造成是小概率事件,否定H 0,接受HA。即:犊牛和成年母牛血液中血糖含量存在极显著差异。第42页,本讲稿共65页第43页,本讲稿共65页 第44页,本讲稿共65页第45页,本讲稿共65页t检验t值计算公式如下:t分布的自由度:第46页,本讲稿共65页 例6:研究两种不同中药添加剂饲料对香猪生长的影响,随机选择了12头香猪并随机分成两组,一组喂甲种饲料,另一组喂乙种饲料。饲养6周后增重(kg)结果如下:甲种饲料:6.65,
18、6.35,7.05,7.90,8.04,4.45;乙种饲料:5.34,7.00,7.89,7.05,6.74,7.28。设两样本所属总体服从正态分布,且方差相等,试比较两种不同饲料对香猪生长的影响是否有显著差异。本例总体方差未知,但,两样本含量相等且均较小,用合并均方计算t值。1、建立假设 第47页,本讲稿共65页2、计算检验统计量3、查表推断 第48页,本讲稿共65页 例7:测定金华猪与长白猪肌内脂肪含量(%),金华猪共10头,平均值为3.93,标准差为0.4;长白猪4头,其平均值为2.56,标准差为0.4。试检验两品种猪的肌内脂肪含量是否存在显著差异。第49页,本讲稿共65页第50页,本讲
19、稿共65页第三节第三节 配对资料两平均值检验配对资料两平均值检验一、配对试验设计的设计方法 所谓配对试验设计,是先将试验条件尽可能相同的试验单元配成一对,然后将每一个对子内的两个试验单元独立随机地接受两个处理中的一种。配对设计的要求是:配成对子的两个试验单元的初始条件应尽可能一致;不同试验对子间的初始条件允许存在差异(有时为了使试验结果有更广泛的适应性,还应有意识地扩大对子间的差异)。每一个对子就是试验的一次重复。第51页,本讲稿共65页 配对的方式有以下几种:1同源配对 可以将同窝或有一定亲缘关系的同性别、体重接近的两头动物配成一对,若干对这样的动物组成的配对叫同源配对,又称亲缘配对。2条件
20、配对 实际工作中,如达不到亲缘配对要求,也可将具有相近条件的试验单位配成对子,若干对这样的动物组成的配对叫条件配对。如动物可按同种属、同性别、同年龄、同体重进行配对。第52页,本讲稿共65页 3自身配对 自身配对是指同一试验单位接受试验处理前后的两次测定值构成的配对;也可以是同一个动物个体对称的两个器官、组织、部位等构成的配对;同一份样品分成两半,一份接受一种处理,另一份接受另一种处理构成的配对。如n只小白鼠,同一个体X射线照射前后的两次体况测定值属自身配对;研究兔不同的拔毛方式对毛囊结构的影响,可以选择兔背中线两侧对称的区域作为配对的试验单位,也属于自身配对;两种不同方法分别测定n个动物个体
21、药物残留所得数据,属于自身配对。第53页,本讲稿共65页二、配对设计资料的假设检验二、配对设计资料的假设检验第54页,本讲稿共65页处理处理配对观测值(配对观测值(x xijij)样本容量样本容量样本平均数样本平均数1 1 2 2 n第55页,本讲稿共65页第56页,本讲稿共65页 第57页,本讲稿共65页 例8:在研究日粮VE含量与肝中VA储量的关系时,随机选择8窝试验用小白鼠,每窝选择性别、体重相近的两只小白鼠进行配对,每对小白鼠中的一只随机接受正常饲料,另一只接受VE缺乏饲料。经过一段时间后,测定小白鼠肝中VA的储量,结果如下表,试检验不同VE含量的日粮对肝中VA的储量是否有显著的影响。
22、表表1 不同不同VE含量的饲料肝小白鼠中含量的饲料肝小白鼠中VA含量(含量(IUg-1)配对动物配对动物编号编号1 12 23 34 45 56 67 78 8 合计合计正常饲料正常饲料组组35503550200020003000300039503950380038003750375034503450305030502655026550V VE E缺乏组缺乏组24502450240024001800180032003200325032502700270025002500175017502005020050差数差数d d11001100-400-40012001200750750550550105010509509501300130065006500第58页,本讲稿共65页 本例是配对试验资料,根据专业知识我们并不知道VE正常供给与否是增加还是减少肝中的VA储量,故应用两尾检验。第59页,本讲稿共65页第四节参数估计第四节参数估计 所谓参数估计就是用样本统计量来估计总体参数,有 点估计 和区间估计 之分。第60页,本讲稿共65页第61页,本讲稿共65页第62页,本讲稿共65页第63页,本讲稿共65页第64页,本讲稿共65页第65页,本讲稿共65页