《医药卫生医学统计学假设检验.pptx》由会员分享,可在线阅读,更多相关《医药卫生医学统计学假设检验.pptx(72页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、教学目的与要求 掌握:假设检验原理单样本正态资料的假设检验两样本正态资料的假设检验二项分布与Poisson分布资料的Z检验假设检验应注意的问题了解:置信区间与假设检验的关系第1页/共72页教学内容提要 重点讲解:假设检验原理单样本正态资料的假设检验两样本正态资料的假设检验Z检验假设检验应注意的问题介绍:置信区间与假设检验的关系 第2页/共72页假设检验的基本任务:事先对总体分布或总体参数作出假设,利用样本信息判断原假设是否合理,从而决定是否拒绝或接受原假设。参数检验(parametrictest):若总体分布类型已知,需要对总体的未知参数进行假设检验。非参数检验:若总体分布类型未知,需要对未知
2、分布函数的总体的分布类型或其中的某些未知参数进行假设检验。第3页/共72页假设检验假设检验(hypothesis test)的基本思想的基本思想 亦称显著性检验(significancetest)是先对总体的特征(如总体的参数或分布、位置)提出某种假设,如假设总体均数(或总体率)为一定值、总体均数(或总体率)相等、总体服从某种分布、两总体分布位置相同等等,然后根据随机样本提供的信息,运用“小概率原理”推断假设是否成立。“概率很小(接近于零)的事件在一次抽样中不太可能出现,故可以认为小概率事件在一次随机抽样中是不会发生的”。第4页/共72页“小概率原理”例如在2000粒中药丸中只有一粒是虫蛀过的
3、,现从中随机取一粒,则取得“虫蛀过的药丸”的概率是1/2000,这个概率是很小的,因此也可以将这一事件看作在一次抽样中是不会发生的。若从中随机抽取一粒,恰好是虫蛀过的,这种情况发生了,我们自然可以认为“假设”有问题,即虫蛀率p不是1/2000,从而否定了假设。否定假设的依据就是小概率事件原理。由此我们得到一个推理方法:如果在某假设(记为H0)成立的条件下,事件A是一个小概率事件,现在只进行一次试验,事件A就发生了,我们就认为原来的假设(H0)是不成立的。第5页/共72页例如,根据大量调查,已知正常成年男性平均脉搏数为72次/分,现随机抽查了20名肝阳上亢成年男性病人,其平均脉搏为84次/分,标
4、准差为6.4次/分。问肝阳上亢男病人的平均脉搏数是否较正常人快?以上两个均数不等有两种可能:第一,由于抽样误差所致;第二,由于肝阳上亢的影响。第6页/共72页例 如 已知正常成年男子脉搏平均为72次/分,现随机检查20名慢性胃炎所致脾虚男病人,其脉搏均数为75次/分,标准差为6.4次/分,问此类脾虚男病人的脉搏快于健康成年男子的脉搏?抽样误差?脾虚?第7页/共72页假设检验:1、原因2、目的3、原理4、过程(步骤)5、结果第一节 假设检验原理某事发生了:是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这类问题。第8页/共72页1、假设检验的原因由于总体不同或因个体差异的存在,在研究
5、中进行随机抽样获得的样本均数,x1、x2、x3、x4,不同。样本均数不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性(差别无统计学意义)(2)分别所代表的总体均数不同。差别有显著性(差别有统计学意义)2、假设检验的目的 判断是由于何种原因造成的不同,以做出决策。第9页/共72页 反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。概率论(小概率):如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是“不会发生的”。从一般的常识可知,这句话在大
6、多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。3、假设检验的原理第10页/共72页4、假设检验的步骤建立假设(反证法),确定显著性水平()计算统计量:u,t,2确定概率P值做出推论第11页/共72页【例5-1】已知正常成年男子脉搏平均为72次/分,现随机检查20名慢性胃炎所致脾虚男病人,其脉搏均数为75次/分,标准差为6.4次/分,推断此类脾虚男病人的脉搏是否不同于健康成年男子的脉搏。第12页/共72页(1)建立假设,选定检验水准:假设两种:一种是检验假设,假设差异完全由抽样误差造成,常称无效假设,用H0表示。另一种是和H0相对立的备择假设,用H1表示。假设检验是
7、针对H0进行的。确定双侧或单侧检验:H0:此类脾虚病对脉搏数无影响,H0:=72次/分H1:脾虚病人的脉搏数不同于正常人,H1:72次/分选定检验水准:=0.05=0.05 是在统计推断时,预先设定的一个小概率值,是当H0为真时,允许错误地拒绝H0的概率。第13页/共72页第14页/共72页双侧与单侧检验界值比较 第15页/共72页(2)(2)选定适当的检验方法,计算检验统计量值 t 检验Z 检验设计类型资料的类型和分布统计推断的目的n的大小如完全随机设计实验中,已知样本均数与总体均数比较,n又不大,可用t检验,计算统计量t值。第16页/共72页(3)计算P值P值:是在H0成立时,取得大于或等
8、于现有检验统计量值的概率。第17页/共72页(3)计算概率值(P)将计算得到的Z Z值或 t t值与查表得到Z 或t,,比较,得到 P P值的大小。根据u u分布和t t分布我们知道,如果|Z|Z|Z 或|t|t ,则 PP ;如果|Z|Z|Z 或|t|P 。第18页/共72页 当P时,统计学结论为按所取检验水准拒绝H0,接受H1,称“差异有显著性”(“差异有统计学意义”)。当P 时,没有理由怀疑H0的真实性,统计学结论为按所取检验水准不拒绝H0,称“差异无显著性”(“差异无统计学意义”)。(4)作出推断结论第19页/共72页第20页/共72页与P异同 相同:与P都是用检验统计量分布的尾部面积
9、大小表示。不同:是在统计推断时,预先设定的一个小概率值,是当H0为真时,允许错误地拒绝H0的概率,是检验水准。P值是由实际样本决定的,是指从由H0所规定的总体中随机抽样,获得大于及等于(或小于)现有样本检验统计量值的概率。第21页/共72页5、两类错误(I I型错误 与型错误)统计推断可能出现的4种结果拒绝H0,接受H1不拒绝H0H0为真 H0为假I型错误()推断正确(1)推断正确(1)型错误()(假阳性错误)(假阴性错误)(检验效能、把握度)(可信度)无效假设(H0)备择假设(H1)第22页/共72页两类错误(型错误与型错误):型错误:H H0 0原本是正确的 拒绝H H0 0 弃真 假阳性
10、错误 误诊 用表示 型错误:H H0 0原本是错误的 不拒绝H H0 0 存伪 假阴性错误 漏诊 用表示 第23页/共72页两均数的假设检验样本均数与总体均数的比较 成对资料均数的 t 检验 成组资料两样本均数的比较 方差不齐时两小样本均数的比较 第24页/共72页第二节 单样本正态资料的假设检验不满足不满足满足满足已知正态性非参数检验变量替换结论不满足大样本u检验t 检验满足z思路一、正态总体均数的假设检验 第25页/共72页方 法第26页/共72页1、大样本【例5-2】一般女性平均身高160.1cm。某大学随机抽取100名女大学生,测量其身高,身高的均数是163.74cm,标准差是3.80
11、cm。请问某大学18岁女大学生身高是否与一般女性不同。第27页/共72页 目的:比较样本均数所代表的未知总体均数 与已知总体均数有无差别计算公式:z 统计量=适用条件:(1)已知一个总体均数;(2)可得到一个样本均数;(3)可得到该样本标准误;(4)样本量不小于100。第28页/共72页假设检验:建立假设,确定显著性水平():检验假设:某校女大学生身高均数与一般女子身高均数相同,H0:=0;备择假设:某校女大学生身高均数与一般女子身高均数不同,H1:0=0.05第29页/共72页做出推论:Z=9.581.96,p0.05=,小概率事件发生了,原H0假设不成立;拒绝H0,接受H1,可认为:某校女
12、大学生身高均数与一般女子身高均数不同;某校女大学生身高均数与一般女子身高均数差别有显著性。计算统计量:Z统计量:Z=确定概率值:|Z|=9.58Z=1.96|Z|Z pt0.05(15),p0.05做出推论:p0.050.0482。0.05n5,1.414,S0.0882,dfn14,查统计用表6得单侧概率Pt0.05(9)p0.05 判断结果:因为p p 0.05,0.05,故拒绝检验假设H H0 0,1010名病人透析前后血中尿素氮含量差异有显著性,即透析可以降低血中尿素氮含量。第42页/共72页【例5 5-6】为研究三棱莪术液的抑瘤效果,将20只小白鼠配成10对,将每对中的两只小白鼠随机
13、分到实验组和对照组中,两组都接种肿瘤,实验组在接种肿瘤三天后注射30%的三棱莪术液0.5mL,对照组则注射蒸馏水0.5mL。结果见表5-4。比较两组瘤体大小是否相同。第43页/共72页第44页/共72页单侧检验第45页/共72页二、成组资料两样本均数的比较方 差 齐性?成 组 t检验非参数检验不满足正态性?变量变换满足满足不满足变量变换t检验结论思路小样本:大样本:先进行F检验,再作Z检验第46页/共72页1、成组资料的方差齐性检验成组t检验的前提条件是两总体方差齐。两总体方差相等称为方差齐性,两总体方差不等称为方差不齐。检验两组资料的方差是否齐性,以决定采用适宜的检验统计量。方差齐性检验假设
14、:查F界值表(附表8)确定P大小,作推论第47页/共72页【例5-9】研究功能性子宫出血症实热组与虚寒组的免疫功能,测定淋巴细胞转化值如表5-5所示。设两组的淋巴细胞转化值都服从正态分布,判断两组的总体方差是否不等。第48页/共72页第49页/共72页2、成组资料的t检验第50页/共72页【例5-11】干燥芜菁叶含钙量服从正态分布,用两种方法各10次测定含钙量(g/100g),测定值均数分别为 2.2150(g/100g)、2.2651(g/100g),标准差分别为S10.1284(g/100g)、S20.0611(g/100g)。第1种方法测定的含钙量是否低于第2种方法?第51页/共72页第
15、52页/共72页【例5-12】某地检查正常成年人的血液红细胞数,样本容量、均数、标准差分别为:男子组156名、465.13万/mm3、54.80万/mm3,女子组74 名、422.16万/mm3、49.20万/mm3。若该地正常成年男女血液红细胞数均服从正态分布,判断其红细胞平均数是否与性别有关。第53页/共72页第54页/共72页第四节二项分布与Poisson分布资料的Z检验一、二项分布资料的Z检验 1.单组资料的Z检验2.成组资料的Z检验第55页/共72页1单组资料的Z检验如果二项分布的或(1)均不太小,则当n足够大时,二项分布接近正态分布,故二项分布资料的样本率与总体率比较可用z检验:Z
16、(Xn0)/(5-6)式中X为阳性频数;0为已知总体率;n为样本含量。若不用绝对数表示,改用率表示时,将上式的分子、分母同时除以n:Z(p0)/(5-7)n不大时,用连续性校正式:Z(|p0|0.5/n)/(5-8)第56页/共72页【例5-13】根据以往经验,一般胃溃疡病患者有20%发生胃出血症状。现观察65岁以上胃溃疡病人304例,有96例发生胃出血症状。推断老年胃溃疡患者是否比较容易出血。H0:20%,即老年患者胃出血率与一般患者相同;H1:20%。样本出血率96/30431.58%,按公式(5-7)Z(0.31580.20)/5.0471Z单侧界值Z0.012.33,P0.01。按0.
17、01水准拒绝H0,接受H1,可认为老年胃溃疡病患者较一般患者容易发生胃出血。第57页/共72页2成组资料的Z检验n1与n2均大于50时,两样本率p1X1/n1,p2X2/n2比较Z=(p1p2)/(5-11)两样本率的合并标准误为(5-10)合并样本率pc的计算公式为:pc=(5-9)若两个样本率均有p与(1p)大于1%,且np与n(1p)均大于5,则两样本率的比较亦可用Z检验。第58页/共72页【例5-14】用某中草药治疗慢性支气管炎患者,其中吸烟组治疗86人,显效35人,不吸烟组治疗107人,显效82人,推断吸烟与不吸烟组显效率是否相同。H0:1=2;H1:12。=0.05p1=X1/n1
18、=35/86=0.4070,p2=X2/n282/107=0.7664pc=0.6062,0.0717Z=(0.40700.7664)/0.0717=5.0119因 Z|2.58,P0.01,按=0.05水准拒绝H0,接受H1。可认为用该中药治疗慢性气管炎不吸烟组的显效率高于吸烟组。第59页/共72页二、Poisson分布资料的Z检验单组资料的Z检验成组资料的Z检验第60页/共72页1单组资料的Z检验当Poisson分布的均数20时,Poisson分布近似正态分布,样本阳性频数X与已知总体平均数0比较可用正态近似Z检验,检验统计量为Z(X0)/(5-12)【例5-15】一般认为全国食管癌死亡率
19、为28/10万,某省1990年死亡回顾调查10万人,食管癌死亡人数22人,该地食管癌死亡率水平是否与全国相同?第61页/共72页2成组资料的Z检验当两总体均数的估计值均大于20时,可用正态近似作两样本均数比较的Z检验。根据两样本的观察单位数是否相等,分为两种情况计算:当两样本n1n2时,Z值计算公式为 Z(X1X2)/(5-13)当两样本n1n2时,由样本均数计算Z值 Z=(12)/(5-14)第62页/共72页例 题【例5-15】用艾叶苍术烟雾对室内空气进行消毒,在室内设6个地点,每点消毒前后各放置一平皿(时间及空间相同)。培养葡萄球菌个数消毒前分别为22,27,23,29,20,23;消毒
20、后分别为12,8,15,19,10,12。比较消毒前后效果有无差别?【例5-17】某制药车间在改革工艺前,测取3次,每升空气中分别有38、29、36颗粉尘。改进工艺后,测取2次,分别有25、18颗粉尘。推断工艺改革前后粉尘数有无差别?第63页/共72页1、正确理解假设检验的结论(概率性)、正确理解假设检验的结论(概率性)假设检验的结论是假设检验的结论是根据概率推断根据概率推断的,所以不的,所以不是绝对正确的:是绝对正确的:(1)当 p ,不能拒绝不能拒绝H0,不能接受不能接受H1,按不能接受,按不能接受H1下结论,也可能犯错误;下结论,也可能犯错误;第五节 假设检验应注意的问题第64页/共72
21、页J(1)当拒绝H0时,可能犯错误,可能拒绝了实际上成立的H0,称为类错误(“弃真”的错误),其概率大小用 表示。J(2)当不能拒绝H0时,也可能犯错误,没有拒绝实际上不成立的H0,这类称为II类错误(”存伪”的错误),其概率大小用 表示,值一般不能确切的知道。2 2、第、第 I I 类错误和第类错误和第 II II 类错误类错误假设检验的结果有两种:假设检验的结果有两种:第65页/共72页 II 类错误的概率 值的两个规律:1.当样本量一定时,愈小,则 愈大,反之;2.2.当 一定时,样本量增加,减少.第66页/共72页3.统计学中的差异显著或不显著,和日常生活中所说的差异大小概念不同。(不
22、仅区别于均数差异的大小,还区别于均数变异的大小)4 4、其它注意事项、其它注意事项选择假设检验方法要注意符合其应用条件;当不能拒绝H0时,即差异无显著性时,应考虑的因素:可能是样本例数不够;单侧检验与双侧检验的问题第67页/共72页第六节第六节 置信区间与假设检验的置信区间与假设检验的关系关系 一、置信区间兼具参数估计和假设检验双重功效,在水准上两者的结论一致。双侧检验时:如例5-8,5-10,置信区间结论与t 检验结果一致。第68页/共72页单侧检验时:(1)若关心的是0?的上侧95置信区间为:-t 0.05,dfs/如例4-3,H0:0(0=72次/分);H1:0。0.05。t 0.05(df)s/75-1.7296.4/72.52的上侧95置信区间为72.52,现072次/分不在此区间范围内,故按0.05水准拒绝H0,接受H1,结论与前述t 检验结果一致。(2)若关心的是 0?的下侧95置信区间为:+t 0.05(df)s/第69页/共72页二、置信区间比假设检验有可提供更多信息之处 第70页/共72页三、置信区间不能完全取代假设检验 置信区间用作假设检验只能在规定的水准上揭示差异有无统计学意义。假设检验可得到的P值,可以精确地说明结论的概率保证,可以估计假阴性率。最好同时给出假设检验的检验统计量值、P值和置信区间第71页/共72页谢谢您的观看!第72页/共72页