《总体均数的估计与假设检验(第3章).ppt》由会员分享,可在线阅读,更多相关《总体均数的估计与假设检验(第3章).ppt(88页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、总体均数的估计与假设检验(第3章) Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life, there is hope。有生命必有希望。有生命必有希望u了解总体特征的最好方法是对总体的每一了解总体特征的最好方法是对总体的每一 个体进行观察、试验,但这在医学研究实个体进行观察、试验,但这在医学研究实 际中往往不可行。际中往往不可行。u对对无限总体无限总体不可能对所有个体逐一观察,不可能对所有个体逐一观察, 对对有限总体有限总体限于人力、财力、物力、时间限于人力、财力、物力、时间 或个体过多等原因,不可能也没必要对所或个体过多等原因
2、,不可能也没必要对所 有个体逐一研究有个体逐一研究(如对一批罐头质量检查如对一批罐头质量检查)。u借助借助抽样研究抽样研究。 u欲了解某地欲了解某地18岁男生身高值的平均水平,岁男生身高值的平均水平, 随机抽取该地随机抽取该地10名男生身高值作为名男生身高值作为样本样本。u由于由于个体变异与抽样个体变异与抽样的影响,抽得的样本的影响,抽得的样本 均数不太可能等于总体均数,造成样本均数不太可能等于总体均数,造成样本统统 计量与总体参数间的差异计量与总体参数间的差异(表现为来自同一表现为来自同一 总体的若干样本统计量间的差异总体的若干样本统计量间的差异),称为,称为抽抽 样误差样误差。u抽样误差是
3、不可避免的。抽样误差是不可避免的。u抽样误差是有规律的。抽样误差是有规律的。1999年某市年某市18岁男生身高值岁男生身高值 XiN(, 2) =167.7cm =5.3cm样本号样本号iXiS 1 167.41 2.74 2 165.56 6.57 3 168.20 5.36 99 169.40 5.57100 165.69 5.09ni = 10样本均数抽样分布具有如下特点:样本均数抽样分布具有如下特点: u各样本均数未必等于总体均数各样本均数未必等于总体均数u各样本均数间存在差异各样本均数间存在差异u样本均数围绕样本均数围绕 =167.69cm呈正态分布呈正态分布u样本均数变异度样本均数
4、变异度( )较原总体个较原总体个 体值变异度体值变异度( = 5.3cm)大大缩小大大缩小cm69. 1SX X中心极限定理中心极限定理(central limit theorem) 从均数为从均数为 、标准差为、标准差为 的总体中独立随机的总体中独立随机抽样,当样本含量抽样,当样本含量n较大时,较大时, 样本均数的分布将趋于正态分布样本均数的分布将趋于正态分布 此分布的均数为此分布的均数为 nX 标准差为标准差为 中心极限定理中心极限定理(central limit theorem) 若若 X i 服从正态分布服从正态分布 则则 服从正态分布服从正态分布 若若 X i 不服从正态分布不服从正
5、态分布 n大大(n60):则:则 近似服从正态分布近似服从正态分布 n小小(n60) 按按u分布原理分布原理StStX,2X,2X , X 双侧双侧1、 未知未知3.641.151110XS 0.05 2,92.262t故该地故该地18岁男生身高均数的岁男生身高均数的95%可信区间为可信区间为(164.35, 169.55)cm。=167.7cm 双尾双尾例例 在例在例3-1中抽得第中抽得第15号样本的号样本的 =166.95(cm),S=3.64(cm), 求其总体均数的求其总体均数的95%可信区间。可信区间。 X166.952.2621.1511=164.35169.55(cm)X,2X,
6、2SX Xuu 或或双侧双侧2、 已知已知或或 未知但未知但n足够大足够大: 例例 某地抽取正常成年人某地抽取正常成年人200名,测得其血名,测得其血清胆固醇均数为清胆固醇均数为3.64 mmol/L,标准差为,标准差为1.20mmol/L,估计该地正常成年人血清胆,估计该地正常成年人血清胆固醇均数固醇均数95%可信区间。可信区间。 法,用近似正态分布的方60)/(81. 347. 30849. 096. 164. 320020. 196. 164. 3NLmmol三、可信区间的确切含义三、可信区间的确切含义u从从1999年某市年某市18岁男生身高值总体岁男生身高值总体N(=167.7cm,
7、=5.3cm)中随机抽取中随机抽取100个样本个样本计算了计算了100个估计个估计的的95%CIu其中有其中有95个个CI包含包含了了 有有5个不包含个不包含 =167.7cm20号号 161.00165.57 31号号 161.17167.3354号号 168.05171.00 76号号 167.71174.8482号号 167.98174.27 -2 -1 0 1 2 来自来自N(0,1)的的100个样本所计算的个样本所计算的95%可信区间示意可信区间示意 u正确性正确性:可信度:可信度1,即区间包含总体参数,即区间包含总体参数 的理论概率大小,愈接近的理论概率大小,愈接近1愈好。愈好。u
8、精确性精确性:区间的宽度,区间愈窄愈好。区间的宽度,区间愈窄愈好。u当样本含量为定值时,上述两者互相矛盾。当样本含量为定值时,上述两者互相矛盾。 若只顾提高可信度,则可信区间会变宽。若只顾提高可信度,则可信区间会变宽。评价可信区间估计的优劣:评价可信区间估计的优劣:四、可信区间与参考值范围的区别四、可信区间与参考值范围的区别u可信区间用于估计可信区间用于估计总体参数总体参数,总体参数只,总体参数只 有一个有一个 。u参考值范围用于估计参考值范围用于估计个体值个体值的分布范围,的分布范围, 个体值有很多个体值有很多 。u95%可信区间中的可信区间中的95%是是可信度可信度,即所求可,即所求可 信
9、区间包含总体参数的可信程度为信区间包含总体参数的可信程度为95%。u95%参考值范围中的参考值范围中的95%是一个是一个比例比例,即,即 所求参考值范围包含了所求参考值范围包含了95%的正常人。的正常人。例例 某医生测量了某医生测量了36名从事铅作业男性工人的名从事铅作业男性工人的血红蛋白含量,算得其均数为血红蛋白含量,算得其均数为130.83g/L,标,标准差为准差为25.74g/L。问从事铅作业工人的血红蛋。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值白是否不同于正常成年男性平均值140g/L?u样本均数与总体均数间差异的原因:样本均数与总体均数间差异的原因: 1.总体均数不同总
10、体均数不同? 2.总体均数相同,差异由抽样误差造成总体均数相同,差异由抽样误差造成?u统计推断方法统计推断方法 假设检验假设检验(hypothesis test)1.进行检验假设进行检验假设 假设样本来自某一特定总体假设样本来自某一特定总体2.确定检验水准确定检验水准 确定最大允许误差确定最大允许误差3.选定检验方法计算检验统计量选定检验方法计算检验统计量 计算样本与总体的偏离程度计算样本与总体的偏离程度4.计算与统计量对应的计算与统计量对应的P值值5.作出结论作出结论 根据小概率反证法思想作出推断根据小概率反证法思想作出推断假设检验一般步骤假设检验一般步骤 t 检验检验(Students t
11、-test) 设计设计 完全随机设计单样本完全随机设计单样本 完全随机设计两样本完全随机设计两样本 配对设计配对设计 要求要求 1.n较小较小(单组单组60或两组合计或两组合计60) 2.样本随机地取自样本随机地取自正态总体正态总体 3.两样本均数比较时所对应两总体两样本均数比较时所对应两总体 方差相等方差相等(homogeneity of variance)例例 某医生测量了某医生测量了36名从事铅作业男性工人的名从事铅作业男性工人的血红蛋白含量,算得其均数为血红蛋白含量,算得其均数为130.83g/L,标,标准差为准差为25.74g/L。问从事铅作业工人的血红蛋。问从事铅作业工人的血红蛋白
12、是否不同于正常成年男性平均值白是否不同于正常成年男性平均值140g/L?一、单样本一、单样本t 检验检验1.建立检验假设,确定检验水准建立检验假设,确定检验水准H0: = 0=140g/L 铅作业男性工人的平均血红蛋铅作业男性工人的平均血红蛋 白含量与正常成年男性的相等白含量与正常成年男性的相等H1: 0 =0.05 351361n138. 23674.2514083.130nSXSXt0X0 2.计算检验统计量计算检验统计量3.确定确定P值,作出推断结论值,作出推断结论 |2.138| t0.05/2,35=2.030 P 2 或或 1 2 单侧检验单侧检验H0: 1= 2 H1: 1 2
13、双侧检验。双侧检验。单双侧检验主要根据专业知识预先确定。单双侧检验主要根据专业知识预先确定。双侧检验较保守和稳妥。双侧检验较保守和稳妥。u检验水准检验水准:预先规定的拒绝:预先规定的拒绝假设假设H0时的最时的最大允许误差,它确定了小概率事件标准。大允许误差,它确定了小概率事件标准。在实际工作中常取在实际工作中常取0.05,但并非一成不变。,但并非一成不变。u应根据变量和资料类型、设计方案、统应根据变量和资料类型、设计方案、统 计推断的目的、方法的适用条件等选择计推断的目的、方法的适用条件等选择 检验统计量。检验统计量。u所有检验统计量都是在所有检验统计量都是在H0成立的前提条成立的前提条 件下
14、计算出来的。件下计算出来的。u检验统计量大小反映样本与总体的偏离检验统计量大小反映样本与总体的偏离 程度(如程度(如t值反映样本均数与总体均数值反映样本均数与总体均数 的偏离程度,以标准误进行标准化)的偏离程度,以标准误进行标准化)2.计算检验统计量计算检验统计量 uP值是决策的依据值是决策的依据uP的含义是指从的含义是指从H0规定的总体中随机抽样,规定的总体中随机抽样,其检验统计量等于及大于现有样本的检验其检验统计量等于及大于现有样本的检验统计量的概率。即从统计量的概率。即从H0假设总体中随机抽假设总体中随机抽到差别至少等于现有样本差别的机会到差别至少等于现有样本差别的机会。u根据获得的事后
15、概率根据获得的事后概率P,与事先规定的,与事先规定的概率概率检验水准检验水准 进行比较,看其是否为进行比较,看其是否为小概率事件而得出结论。小概率事件而得出结论。3.确定确定P 值,作出推断结论值,作出推断结论uP ,按按 检验水准,拒绝检验水准,拒绝H0,接受,接受H1有统计学意义有统计学意义(统计结论统计结论)statistical significance可认为可认为不同,不同,高于高于(专业结论专业结论)uP ,按,按 检验水准,不拒绝检验水准,不拒绝H0无统计学意义无统计学意义(统计结论统计结论)no statistical significance还不能认为还不能认为不同不同(专业
16、结论专业结论)不拒绝不拒绝H0不等于接受不等于接受H0,因此时证据不足,因此时证据不足三、三、I型错误和型错误和II型错误型错误 健康人与肝病病人的肝大指数分布健康人与肝病病人的肝大指数分布(所拟合的两个正态曲线各按所拟合的两个正态曲线各按100%面积绘制)面积绘制)肝肝 大大 指指 数数健康人健康人H0肝病病人肝病病人H1第一类错误第一类错误误诊率误诊率 (假阳性率假阳性率)第二类错误第二类错误b漏诊率漏诊率 (假阴性率假阴性率) 6.1 7.0 8.456891011 4 大,大,b b小;小;b b大,大, 小。增加小。增加n可同时缩小可同时缩小 ,b b。 u 可取单尾亦可取双尾可取单
17、尾亦可取双尾。uII型错误的概率大小用型错误的概率大小用b b表示表示, b b只取单尾,只取单尾,b b值的大小一般未知,须在知道两总体差值的大小一般未知,须在知道两总体差值值 (如如 12等等)、 及及n 时,才能算出。时,才能算出。u1bb称称检验效能检验效能(power of a test),过去称把,过去称把握度。为当两总体确有差异,按检验水准握度。为当两总体确有差异,按检验水准 所能发现该差异的能力。所能发现该差异的能力。1bb只取单尾。只取单尾。u拒绝拒绝H0,只可能犯,只可能犯I型错误,不可能犯型错误,不可能犯II型型错误;不拒绝错误;不拒绝H0,只可能犯,只可能犯II型错误,
18、不型错误,不可能犯可能犯I型错误。型错误。 四、假设检验应注意的问题四、假设检验应注意的问题1.要有严密的研究设计要有严密的研究设计组间应均衡,具有可比性,除对比的主要因组间应均衡,具有可比性,除对比的主要因素素(如临床试验用新药和对照药如临床试验用新药和对照药)外,其它可外,其它可能影响结果的因素能影响结果的因素(如年龄、性别、病程、如年龄、性别、病程、病情轻重等病情轻重等)在对比组间应相同或相近。在对比组间应相同或相近。u配对设计计量资料:配对配对设计计量资料:配对t检验。检验。u完全随机设计两样本计量资料:完全随机设计两样本计量资料:小样本小样本(任一任一ni60)且方差齐且方差齐: 两
19、样本两样本t检验检验 方差不齐方差不齐: 近似近似t 检验检验大样本大样本(所有所有ni60): u检验。检验。2.不同资料应选用不同检验方法不同资料应选用不同检验方法3.正确理解正确理解“significance”一词的含义一词的含义u过去称差别有或无过去称差别有或无“显著性显著性”,易造成,易造成两两 样本统计量之间比较相差很大的误解。样本统计量之间比较相差很大的误解。u现在称差别有或无现在称差别有或无“统计学意义统计学意义”, 相应推断为:可以认为或还不能认为两相应推断为:可以认为或还不能认为两 个或多个总体参数有差别。个或多个总体参数有差别。4.结论不能绝对化结论不能绝对化 u因统计结
20、论具有概率性质,故因统计结论具有概率性质,故“肯定肯定”、 “一定一定”、“必定必定”等词不要使用。等词不要使用。u在报告结论时,最好列出检验统计量的在报告结论时,最好列出检验统计量的 值,尽量写出具体值,尽量写出具体P值,而不简单写成值,而不简单写成 P0.05,以便读者与同类研究进行比,以便读者与同类研究进行比 较或进行循证医学时采用较或进行循证医学时采用Meta分析。分析。5.统计统计“有意义有意义”与医学与医学“有意义有意义” u统计统计“有意义有意义”对应统计结论,医学对应统计结论,医学“有有意意 义义”对应专业结论。对应专业结论。u统计结论有意义,专业结论无意义,最终统计结论有意义
21、,专业结论无意义,最终 结论没有意义,样本含量过大或设计存在结论没有意义,样本含量过大或设计存在 问题。问题。u统计结论无意义,专业结论有意义,检查统计结论无意义,专业结论有意义,检查 设计是否合理、样本含量是否足够。设计是否合理、样本含量是否足够。6.可信区间与假设检验区别和联系可信区间与假设检验区别和联系u可信区间可回答假设检验问题可信区间可回答假设检验问题 H0: = 0=140g/L 铅作业男性工人的平均血红蛋铅作业男性工人的平均血红蛋 白含量与正常成年男性的相等白含量与正常成年男性的相等 H1: 0 =0.05 铅作业男性工人平均血红蛋白含量总体铅作业男性工人平均血红蛋白含量总体 均
22、数均数 的的95%CI为为(122.12,139.54) g/L, 未包括未包括 0=140g/L 按按 =0.05水准,拒绝水准,拒绝H0 ,接受,接受H1。 u可信区间说明可信区间说明量的大小量的大小即推断总体均数即推断总体均数 所在范围,假设检验推断所在范围,假设检验推断质的不同质的不同即判即判 断两总体均数是否不等。断两总体均数是否不等。u可信区间不但能回答差别有无统计学意可信区间不但能回答差别有无统计学意 义,还能提示差别有无实际专业意义。义,还能提示差别有无实际专业意义。u可信区间不能够完全代替假设检验。可可信区间不能够完全代替假设检验。可 信区间只能在预先规定概率信区间只能在预先
23、规定概率 的前提下的前提下 进行计算,而假设检验能获得一较为确进行计算,而假设检验能获得一较为确 切的切的P值。值。两小样本两小样本t 检验前提条件:检验前提条件:相应的两总体为正态总体相应的两总体为正态总体两总体方差相等,即方差齐性两总体方差相等,即方差齐性配对配对t 检验前提条件:检验前提条件:每对数据每对数据差值差值的总体为正态总体的总体为正态总体一、正态性检验一、正态性检验(了解了解)1.图示法图示法u概率图概率图(probability-probability plot)以实际累积频率以实际累积频率(X)对正态分布理论累积频率对正态分布理论累积频率(Y)作散点图作散点图u分位数图分位
24、数图(quantile-quantile plot)以实际分位数以实际分位数(X)对正态分布理论分位数对正态分布理论分位数 ( )作散点图作散点图u如果实际值与理论值吻合,图中散点几乎如果实际值与理论值吻合,图中散点几乎都在一直线上,可认为该资料服从正态分布都在一直线上,可认为该资料服从正态分布 S/ )XX(Y Normal Q-Q Plot of 100个样本均数(cm)Observed Value174172170168166164162Expected Normal3210-1-2-3(168-167.69)/1.69=0.18(164-167.69)/1.69=-2.18(172-1
25、67.69)/1.69=2.552.计算法计算法u偏度偏度(skewness)指分布不对称的程度和方向指分布不对称的程度和方向,用偏度系数,用偏度系数(总体总体: 1 样本样本:g1)衡量。衡量。 1=0 对称对称 10 正偏态正偏态 10 负偏态负偏态u峰度峰度(kurtosis)指分布与正态曲线相比的冒指分布与正态曲线相比的冒尖或扁平程度,用峰度系数尖或扁平程度,用峰度系数(总体总体: 2 样本样本:g2)衡量。衡量。 2=0 正态峰正态峰 20 尖峭峰尖峭峰 20 平阔平阔峰峰u当同时满足对称和正态峰两个条件时,才能当同时满足对称和正态峰两个条件时,才能认为该资料服从正态分布。认为该资料
26、服从正态分布。u对偏度和峰度各用一个指标评定,其中以对偏度和峰度各用一个指标评定,其中以矩法矩法(method of moment)效率最高效率最高Tests of N ormality.046100.200*.994100.944样本均数(cm)StatisticdfSig.StatisticdfSig.Kolmogorov-SmirnovaShapiro-WilkThis is a lower bound of the true significance.*. Lilliefors Significance Correctiona. u对偏度和峰度用一个指标综合评定对偏度和峰度用一个指标综
27、合评定 H0: 1=0且且 2=0,总体服从正态分布,总体服从正态分布 H0: 10且且 20,总体不服从正态分布,总体不服从正态分布 =0.10(减少(减少型错误)型错误)二、两样本方差比较的二、两样本方差比较的F检验检验u第一个样本方差既可能大于也可能小于第二第一个样本方差既可能大于也可能小于第二 个样本方差,是个样本方差,是双侧检验。双侧检验。u公式规定以较大方差作分子,公式规定以较大方差作分子,F必然大于必然大于1。21,2/F 附表附表3仅给出不对称仅给出不对称F分布右侧界值分布右侧界值 1n, 1n SSF22112221 (较较小小)(较较大大) X研究目的:阿卡波糖胶囊降血糖效
28、果研究目的:阿卡波糖胶囊降血糖效果试验设计:同期随机对照试验试验设计:同期随机对照试验受试对象:受试对象:40名名II型糖尿病病人型糖尿病病人试验组:阿卡波糖胶囊试验组:阿卡波糖胶囊对照组:拜唐苹胶囊对照组:拜唐苹胶囊观测指标:试验观测指标:试验8周后糖化血红蛋白下降值周后糖化血红蛋白下降值 (1)建立检验假设,确定检验水准。建立检验假设,确定检验水准。0.10 : :2221122210HH(2)计算检验统计量计算检验统计量221.363.7750.70F 122011920119(3)确定确定P值,作出推断结论值,作出推断结论3.7752.15=F0.10(20,19) P0.10按按 =0.10水准,拒绝水准,拒绝H0,接受,接受H1,有统计,有统计学意义。可认为对照组和试验组病人试验学意义。可认为对照组和试验组病人试验8周后糖化血红蛋白下降值总体方差不等。周后糖化血红蛋白下降值总体方差不等。