《最新卫生统计学-潘海燕 卫统7假设检验-听课2精品课件.ppt》由会员分享,可在线阅读,更多相关《最新卫生统计学-潘海燕 卫统7假设检验-听课2精品课件.ppt(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计分析:统计分析: 统计描述统计描述 统计推断统计推断: 参数估计参数估计 假设检验假设检验假设检验(假设检验(hypothesis test,significant test)是统计是统计推断的另一部分重要内容。推断的另一部分重要内容。.000 x由抽样误差引起由本质差别引起两种假设可以总结为:两种假设可以总结为::0H:1H假设假设 ,即认为的差别是由抽样误差造成,即认为的差别是由抽样误差造成的则可用公式计算的则可用公式计算t t值。根据值。根据t t值确定值确定 P P 值的大小,值的大小,并作出推断。并作出推断。 P P 小于或等于预先规定的概率值小于或等于预先规定的概率值 (如(如
2、0.050.05),),则为小概率事件,即在一次抽样中发生的可能性则为小概率事件,即在一次抽样中发生的可能性很小,如果它发生了,则怀疑原假设很小,如果它发生了,则怀疑原假设可能不成立,故认为其对立面可能不成立,故认为其对立面 成立。成立。 000假设检验假设检验(hypothesis testing)基本思想基本思想 应用反证法和小概率事件的原理,先对总体的参应用反证法和小概率事件的原理,先对总体的参数或分布作出某种假设,在数或分布作出某种假设,在 成立的条件下成立的条件下,再用再用适当的方法(如适当的方法(如 t 检验)根据样本对总体提供的信检验)根据样本对总体提供的信息,推断此假设应当拒绝
3、或不拒绝。息,推断此假设应当拒绝或不拒绝。0H具体解释:具体解释: 假设某两个或多个总体参数相等、总体分布假设某两个或多个总体参数相等、总体分布相同或总体服从某种分布(称为原假设)相同或总体服从某种分布(称为原假设) 在该假设成立时计算相应的检验统计量在该假设成立时计算相应的检验统计量 如如t t、F F等等 根据相应的分布确定根据相应的分布确定P P值,作出统计推断值,作出统计推断 若若P值小于或等于预先规定的小概率水准值小于或等于预先规定的小概率水准 (如(如0.05),则拒绝原假设),则拒绝原假设 。若若P值大于预先规定的小概率水准,则尚无值大于预先规定的小概率水准,则尚无充分的理由拒绝
4、原假设。充分的理由拒绝原假设。 2.假设检验的一般步骤假设检验的一般步骤2.1建立检验假设,确定检验水准建立检验假设,确定检验水准 :无效假设或零假设无效假设或零假设(null hypothesis) :备择假设:备择假设(alternative hypothesis) 检验水准检验水准(significance level) 通常取通常取 =0.05根据专业知识和研究目的确定单双侧检验(见根据专业知识和研究目的确定单双侧检验(见第三节)第三节)0H1H对于检验假设,须注意:对于检验假设,须注意: 检验假设是针对总体而言,而不是针对样本;检验假设是针对总体而言,而不是针对样本; H0和和H1是
5、相互联系,对立的假设,后面的结论是相互联系,对立的假设,后面的结论是根据是根据H0和和H1作出的,因此两者不是可有可无,作出的,因此两者不是可有可无,而是缺一不可;而是缺一不可;【例【例7-1】2.1 建立检验假设,确定检验水准建立检验假设,确定检验水准 :该地该地1 1岁婴儿的岁婴儿的HBHB浓度总体均数与一般正常浓度总体均数与一般正常 小儿的小儿的HBHB浓度总体均数相等,即浓度总体均数相等,即 :该地:该地1 1岁婴儿的岁婴儿的HBHB浓度总体均数浓度总体均数 与一般正与一般正 常小儿的常小儿的HBHB浓度总体均数不等,即浓度总体均数不等,即 =0.050H1H002.2 选定检验方法计
6、算检验统计量选定检验方法计算检验统计量 根据研究目的、资料类型、分布类型、设计根据研究目的、资料类型、分布类型、设计类型、样本含量及适用条件等,选择合适的统类型、样本含量及适用条件等,选择合适的统计方法,计算相应的检验统计量。计方法,计算相应的检验统计量。0123.5 1250.646611.625xxtS 124n 2.3 确定确定 值,作出推断结论值,作出推断结论 若若 ,则按,则按 水准,拒绝水准,拒绝 ,接受,接受 ,差异有统计,差异有统计学意义(学意义(statistical significance),可认为),可认为不同或不等不同或不等 P若若 ,则按,则按 水准水准,不拒绝不拒
7、绝 ,差异无统计学,差异无统计学意义(意义( no statistical significance),尚不能认为),尚不能认为不同或不等不同或不等 PP0H0H1H图图7-1 由由t 分布确定值的示意图分布确定值的示意图 本例中 , , ,故按 的水准,不拒绝 ,差异无统计学意义(统计结论),(统计结论),尚不能认为该地1岁婴儿的血红蛋白浓度平均水平与一般正常小儿的血红蛋白浓度平均水平有差别(专业结论)(专业结论)。 0.05 2,242.064t0.05 2,24tt05. 0P05. 00H2 型错误与型错误 【例【例7-2】总体总体是是100100例平原地区正常成年男子的红细胞例平原地
8、区正常成年男子的红细胞数,其总体参数数,其总体参数 , , ;总体总体B B是是100100例高原地区正常成年男子的红细胞数,例高原地区正常成年男子的红细胞数,其总体参数其总体参数 , , 。现从总体现从总体B B中随机抽取的样本,其统计量为:中随机抽取的样本,其统计量为: L/1000.512L/1043. 012L/1050. 512L/1045. 012125.29 10/xL120.42 10/SL【例【例7-2】若将该样本与总体若将该样本与总体比较,则得比较,则得 1835. 2t0569. 0P按按 水准,不拒绝水准,不拒绝 ,差别无统计学,差别无统计学意义,尚不能认为总体意义,尚
9、不能认为总体A A与总体与总体B B的红细胞均的红细胞均数不同。数不同。 05. 00H型错误型错误(type error) :拒绝了拒绝了实际上成立的实际上成立的 ,犯,犯“弃真弃真”的的错误。其概率大小用错误。其概率大小用 表示表示, , 可可取单侧亦可取双侧。取单侧亦可取双侧。0H型错误型错误(type error) :不拒绝了实不拒绝了实际上不成立的际上不成立的H0,犯,犯“存伪存伪”的错误。其概的错误。其概率大小用率大小用表示。表示。 只取单侧,其大小一般只取单侧,其大小一般未知,只有在已知两总体差值未知,只有在已知两总体差值 , 及及 n n 时时,才能估算出来。,才能估算出来。
10、实际情况检验结果拒绝H0不拒绝H0成立第类错误()结论正确(1-) 不成立结论正确(1-)第类错误() 推断结论与两类错误推断结论与两类错误0H0H图7-2 型错误与型错误示意图 检验效能检验效能(power of a test) : 若两总体确有差别,按照水准能够发现这种差别的能力。 它的大小用(1-)表示。(计算详见第十七章)检验效能的影响因素容许误差容许误差 总体标准差总体标准差 型错误型错误 样本含量样本含量 n3 单侧检验与双侧检验单侧检验与双侧检验单侧检验与双侧检验 例例7-17-1中,该医生无法事先判断该地的环境因中,该医生无法事先判断该地的环境因素如何影响素如何影响1 1岁婴儿
11、的血红蛋白浓度,建立的岁婴儿的血红蛋白浓度,建立的检验假设:检验假设: 00:H01:H显然包括 000 故称双侧检验故称双侧检验(two-sided testtwo-sided test) 05. 0单侧检验与双侧检验单侧检验与双侧检验 称单侧检验(称单侧检验(one-sided testone-sided test) 若检验假设如下: 00001010HHHH:或: 【例例7-3】已知某年某地健康成年男子脉搏均数为已知某年某地健康成年男子脉搏均数为72次次/分。某医生测得某山区分。某医生测得某山区25名健康成年男子脉名健康成年男子脉搏均数为搏均数为74.2次次/分,标准差为分,标准差为6.
12、0次次/分。得:分。得: 查查 界值表界值表 单侧单侧 双侧双侧 83. 1tt711. 124,05. 0t0.05 2,242.064t本题结论应该如何取? 单侧检验与双侧检验的关系单侧检验与双侧检验的关系 同一资料按相同方法分别进行双侧检验和单侧同一资料按相同方法分别进行双侧检验和单侧检验,检验, ,则双侧检验所得的值一般大,则双侧检验所得的值一般大于单侧检验的值。于单侧检验的值。若检验方法所基于的分布是对称的,则双侧检若检验方法所基于的分布是对称的,则双侧检验所得的验所得的 值就是单侧检验所得值就是单侧检验所得 值的值的两倍两倍。 05. 0PP凡双侧检验凡双侧检验 ,单侧检验必,单侧
13、检验必 凡单侧检验凡单侧检验 ,双侧检验必,双侧检验必 PPPP 单侧检验与双侧检验的选择单侧检验与双侧检验的选择 单侧检验,还是双侧检验,应依据专业知识和单侧检验,还是双侧检验,应依据专业知识和研究目的,而不能在确定研究目的,而不能在确定 值时主观选择。值时主观选择。 P误用单侧误用单侧检验会易犯检验会易犯型错误型错误误用双侧误用双侧检验会易犯检验会易犯型错误型错误 以样本均数与总体均数比较为例双侧检验双侧检验单侧检验单侧检验目的 0是否00000是否0是否000H1H4 假设检验应注意的事项1.应有严密的研究设计应有严密的研究设计总体中的每个研究个体应具有同质性样本的获取必须遵循随机化原则
14、比较的组间应具有可比性。 2.正确理解正确理解 水准和水准和 值的意义值的意义 是人为预先设定的一个概率值,可有多个 是假定 成立,得到实际观测数据的可能性的大小 ,一个样本按某一方法只能得出一个 PP0H3.正确理解结论的统计学意义正确理解结论的统计学意义 拒绝 0H样本统计量之间的差值并非仅由抽样误差所致,而是由本质差别造成的,至于其差值幅度是否“明显”或“更显著”等判断,完全属于专业方面的分析。 3.正确理解结论的统计学意义正确理解结论的统计学意义 不拒绝 0H样本统计量之间的差值仅由抽样误差所偶然获得的可能性较大,故尚不能认为被推断的两总体参数有差别,但不应误解为差别不大或肯定无差别。 4.假设检验的结论不能绝对化假设检验的结论不能绝对化所有假设检验的结论都是概率性质的,若 水准不同,则结论不同。 5 假设检验与区间估计的联系