《医学统计学假设检验基础 .ppt》由会员分享,可在线阅读,更多相关《医学统计学假设检验基础 .ppt(86页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、假设检验基础假设检验基础总体总体样本样本统计统计描述描述统计推断统计推断参数估计参数估计假设检验假设检验随机随机抽样抽样统计图统计图统计表统计表统计指标统计指标假设检验的概念与原理假设检验的概念与原理假设检验的基本步骤假设检验的基本步骤t检验检验假设检验与区间估计的关系假设检验与区间估计的关系假设检验的功效假设检验的功效第一节第一节 假设检验的概念与原理假设检验的概念与原理 例例例例1 1 根据大量调查,已知健康成年男子的脉搏均数是根据大量调查,已知健康成年男子的脉搏均数是根据大量调查,已知健康成年男子的脉搏均数是根据大量调查,已知健康成年男子的脉搏均数是7272次次次次/min/min,某医
2、生在山区随机抽查,某医生在山区随机抽查,某医生在山区随机抽查,某医生在山区随机抽查2525名健康成年男子,求名健康成年男子,求名健康成年男子,求名健康成年男子,求得其脉搏均数为得其脉搏均数为得其脉搏均数为得其脉搏均数为74.274.2次次次次/min/min,标准差为,标准差为,标准差为,标准差为6.56.5次次次次/min/min。可。可。可。可否据此认为山区成年男子的脉搏均数与一般健康男性脉否据此认为山区成年男子的脉搏均数与一般健康男性脉否据此认为山区成年男子的脉搏均数与一般健康男性脉否据此认为山区成年男子的脉搏均数与一般健康男性脉搏均数相同?搏均数相同?搏均数相同?搏均数相同?目的:推断
3、山区的健康成年男子脉搏均数目的:推断山区的健康成年男子脉搏均数目的:推断山区的健康成年男子脉搏均数目的:推断山区的健康成年男子脉搏均数(未知总体均数未知总体均数未知总体均数未知总体均数 )与一般健与一般健与一般健与一般健康成年男子脉搏均数康成年男子脉搏均数康成年男子脉搏均数康成年男子脉搏均数(已知总体均数已知总体均数已知总体均数已知总体均数 0 0)间有无差别间有无差别间有无差别间有无差别 =0?0=72(次/min)n=25已知总体已知总体未知总体未知总体显然样本均数与总体均数不等有两种可能:显然样本均数与总体均数不等有两种可能:显然样本均数与总体均数不等有两种可能:显然样本均数与总体均数不
4、等有两种可能:1 1 由于抽样误差所致;由于抽样误差所致;由于抽样误差所致;由于抽样误差所致;2 2 由于环境因素的影响所致。如图所示:由于环境因素的影响所致。如图所示:由于环境因素的影响所致。如图所示:由于环境因素的影响所致。如图所示:已知总体均数已知总体均数0,未知总体均数,未知总体均数?是由抽样误差所致是由抽样误差所致不仅仅是由抽样误差,两不仅仅是由抽样误差,两总体存在本质差异总体存在本质差异假设检验假设检验假设检验假设检验如何判断如何判断如何判断如何判断假设检验的概念假设检验的概念(Hypothesis)先对未知总体进行两种对立的假设,先对未知总体进行两种对立的假设,然后依据有限的样本
5、信息对未知总体的两然后依据有限的样本信息对未知总体的两种对立假设进行抉择的过程。种对立假设进行抉择的过程。假设检验的基本思想假设检验的基本思想小概率事件实际推断原理小概率事件实际推断原理小概率事件在一次随机试验中不大可能发生,如小概率事件在一次随机试验中不大可能发生,如果一次抽样发生了小概率事件,就有理由怀疑前提假果一次抽样发生了小概率事件,就有理由怀疑前提假设的成立。设的成立。反证法反证法提出一个假设,确定当此假设成立时获得现在样本提出一个假设,确定当此假设成立时获得现在样本的的概率大小,如果是小概率事件,则推断假设是假概率大小,如果是小概率事件,则推断假设是假的,拒绝它;如果不是,则认为假
6、设是真的,不能拒的,拒绝它;如果不是,则认为假设是真的,不能拒绝它绝它事件事件AB肯定肯定A A否定否定B B确定检验水准确定检验水准选定检验方法,计算检验统计量选定检验方法,计算检验统计量确定确定值值作出推断结论作出推断结论不能拒绝不能拒绝H0拒绝拒绝H0,接受接受H1PP建立假设,确定单双侧检验建立假设,确定单双侧检验(一)(一)建立假设,确定单双侧检验建立假设,确定单双侧检验建立假设建立假设 :零假设或原假设零假设或原假设(null hypothesis)、无效假设、无效假设 通常为两总体参数相等或服从某分布通常为两总体参数相等或服从某分布 样本均数与总体均数不同是由于抽样误差所致样本均
7、数与总体均数不同是由于抽样误差所致样本均数与总体均数不同是由于抽样误差所致样本均数与总体均数不同是由于抽样误差所致 :备择假设备择假设(alternative hypothesis)、对立假设、对立假设 通常为两总体参数不相等或不服从某分布通常为两总体参数不相等或不服从某分布 样本均数与总体均数不同是由于存在本质差别样本均数与总体均数不同是由于存在本质差别样本均数与总体均数不同是由于存在本质差别样本均数与总体均数不同是由于存在本质差别确定单双侧检验确定单双侧检验由研究目的及专业知识所决定由研究目的及专业知识所决定从备择假设看:从备择假设看:例如例如,在临床试验中,比较甲、乙两种治疗方法的疗效,
8、在临床试验中,比较甲、乙两种治疗方法的疗效是否有差异是否有差异:如果如果只要求区分两方法是否不同,只要求区分两方法是否不同,无需区分何者为优无需区分何者为优,则应选用则应选用双侧检验双侧检验。如果如果有充分的理由认为甲法疗效不比乙法差有充分的理由认为甲法疗效不比乙法差,此时应选,此时应选用用单侧检验单侧检验。选用双侧检验还是单侧检验,应该选用双侧检验还是单侧检验,应该在假设检验的在假设检验的第一步建立检验假设时确定,不应该在算得检验第一步建立检验假设时确定,不应该在算得检验统计量后主观确定统计量后主观确定,否则可能会得到相反结论。,否则可能会得到相反结论。例如例如,对同一份资料进行,对同一份资
9、料进行t检验,如果双侧检验检验,如果双侧检验的的t值等于值等于0.06,根据,根据t分布的对称性,单侧检验分布的对称性,单侧检验的的t值就等于值就等于0.03。假定检验水准。假定检验水准=0.05,则,则双侧双侧检验的结论是不拒绝检验的结论是不拒绝H0,而单侧检验的结论是,而单侧检验的结论是拒绝拒绝H0。因此,对同一份资料作因此,对同一份资料作t检验,单侧检验比双侧检检验,单侧检验比双侧检验验较易获得较易获得有统计学意义的结论。如果本应采用双有统计学意义的结论。如果本应采用双侧检验而误用了单侧检验,易犯侧检验而误用了单侧检验,易犯 I 型错误,即假阳型错误,即假阳性错误性错误。(二)确定检验水
10、准(二)确定检验水准检验水准:为预先规定的小概率事件的标准检验水准:为预先规定的小概率事件的标准通常取值通常取值0.05或或0.01可根据研究目的进行调整可根据研究目的进行调整(三)选择检验方法,计算检验统计量(三)选择检验方法,计算检验统计量应根据研究目的、资料类型、设计类型及样本应根据研究目的、资料类型、设计类型及样本含量大小等因素选择合适的假设检验方法;含量大小等因素选择合适的假设检验方法;在成立的前提下,由样本已知信息构造检验在成立的前提下,由样本已知信息构造检验统计量;统计量;通常根据构造的检验统计量来命名假设检验方通常根据构造的检验统计量来命名假设检验方法。法。不同的统计量涉及的统
11、计分布不同不同的统计量涉及的统计分布不同(四)确定(四)确定 P P 值值值的含义:由值的含义:由H0所规定的总体作随机抽样,获得现有所规定的总体作随机抽样,获得现有样本统计量值及更极端值的概率样本统计量值及更极端值的概率怎样确定怎样确定值:构造的检验统计量服从相应的分布,查值:构造的检验统计量服从相应的分布,查相应分布界值表确定相应分布界值表确定值。值。一般双侧检验查双侧界值表,单侧检验查单侧界值表。一般双侧检验查双侧界值表,单侧检验查单侧界值表。(五)(五)作出推断结论作出推断结论与检验水准与检验水准相比作出推断结论相比作出推断结论,拒绝,拒绝H0,接受接受H1 差别有统计学意义差别有统计
12、学意义(在(在H0成立的前提下,一次随机抽样发生了小概率事成立的前提下,一次随机抽样发生了小概率事件)件),不能拒绝,不能拒绝H0 差别无统计学意义差别无统计学意义(在(在H0成立的前提下,一次随机抽样没有发生了小概成立的前提下,一次随机抽样没有发生了小概率事件,没有充足的理由拒绝率事件,没有充足的理由拒绝H0)推断结论应包括统计结论和专业结论,还必须结合专推断结论应包括统计结论和专业结论,还必须结合专业得出最终结论业得出最终结论1、H0:72,山区成年男子的脉搏均数与一般健康男性山区成年男子的脉搏均数与一般健康男性山区成年男子的脉搏均数与一般健康男性山区成年男子的脉搏均数与一般健康男性脉搏均
13、数相同脉搏均数相同脉搏均数相同脉搏均数相同;H1:72,山区成年男子的脉搏均数与一般健康男性脉山区成年男子的脉搏均数与一般健康男性脉山区成年男子的脉搏均数与一般健康男性脉山区成年男子的脉搏均数与一般健康男性脉搏均数不相同搏均数不相同搏均数不相同搏均数不相同。2、检验水准、检验水准0.053 3、计算检验统计量、计算检验统计量 4 4、按、按 =25-1=24查附表查附表2 t界值表界值表 P P=P P(|(|t t|1.69)1.69)?例题的假设检验基本步骤例题的假设检验基本步骤t0.05,24=2.064 P=P(|t|2.064)=0.05 0.025-2.0642.0640.025=
14、240P=P(|t|1.69)0.050.05 5 5 5 5、本例、本例、本例、本例P P 0.050.05,按,按,按,按 =0.05=0.05的水准,不拒绝的水准,不拒绝的水准,不拒绝的水准,不拒绝H H0 0,差别没,差别没,差别没,差别没有统计学意义,还不能认为有统计学意义,还不能认为有统计学意义,还不能认为有统计学意义,还不能认为山区成年男子的脉搏均数与一山区成年男子的脉搏均数与一山区成年男子的脉搏均数与一山区成年男子的脉搏均数与一般健康男性脉搏均数不相同般健康男性脉搏均数不相同般健康男性脉搏均数不相同般健康男性脉搏均数不相同。第二节第二节 t t检验检验单样本设计的单样本设计的检
15、验检验配对设计的配对设计的检验检验完全随机设计(成组设计)的完全随机设计(成组设计)的检验检验计量资料分析计量资料分析的的 t t 检验检验英国统计学W.S.Gosset(1909)导出了样本均数的确切分布,即t分布。t分布的发现使小样本的统计推断成为可能,因而它被认为是统计学发展史上的里程碑之一。以t分布为基础的检验称为t检验。t t 检验检验t检验亦称检验亦称student t检验。检验。t检验的用途:检验的用途:样本均数与总体均数的比较;样本均数与总体均数的比较;两样本均数的比较。两样本均数的比较。t检验的应用条件:检验的应用条件:当样本例数较小时,要求样本取自正态总体;当样本例数较小时
16、,要求样本取自正态总体;做两样本均数比较时,还要求两样本的总体方差相等。做两样本均数比较时,还要求两样本的总体方差相等。但在实际应用中,与上述条件略有偏离,对结果亦影响不大。但在实际应用中,与上述条件略有偏离,对结果亦影响不大。单样本单样本t t检验检验设计类型:设计类型:例例2 大量研究表明汉族足月正常产男性新生儿临产前大量研究表明汉族足月正常产男性新生儿临产前双顶径(双顶径(BPD)均数为)均数为9.3cm,某医生记录了某山区,某医生记录了某山区12名名汉族足月正常产男性新生儿临产前双顶径(汉族足月正常产男性新生儿临产前双顶径(BPD)资料如)资料如下:下:9.95、9.33、9.49、9
17、.00、10.09、9.15、9.52、9.33、9.16、9.37、9.11、9.27。试问该地区汉族足月正常产男。试问该地区汉族足月正常产男性新生儿临产前双顶径(性新生儿临产前双顶径(BPD)是否大于一般新生儿?)是否大于一般新生儿?例例例例3 3 已知北方农村儿童前囱门闭合月龄为已知北方农村儿童前囱门闭合月龄为已知北方农村儿童前囱门闭合月龄为已知北方农村儿童前囱门闭合月龄为14.114.1月。某研究人员从东北某县抽取月。某研究人员从东北某县抽取月。某研究人员从东北某县抽取月。某研究人员从东北某县抽取3636名儿童,得名儿童,得名儿童,得名儿童,得前囱门闭合月龄均值为前囱门闭合月龄均值为前
18、囱门闭合月龄均值为前囱门闭合月龄均值为14.314.3月,标准差为月,标准差为月,标准差为月,标准差为5.085.08月。问该县儿童前囟门闭合月龄的均数是否大于月。问该县儿童前囟门闭合月龄的均数是否大于月。问该县儿童前囟门闭合月龄的均数是否大于月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?一般儿童?一般儿童?一般儿童?单样本单样本t t检验检验目的目的:推断该样本是否来自某已知总体;推断该样本是否来自某已知总体;样本均数代表的总体均数样本均数代表的总体均数 与与 0是否相等。是否相等。总体均数总体均数 0一般为理论值、标准值或经大量观察一般为理论值、标准值或经大量观察所得并为人们接受的公
19、认值、习惯值。所得并为人们接受的公认值、习惯值。单样本设计单样本设计检验可解决问题检验可解决问题?l假设检验思路假设检验思路先假设先假设 等于等于 0,再判断样本提供的信息是,再判断样本提供的信息是否支持这种假设,若不支持,则可推断该样否支持这种假设,若不支持,则可推断该样本并非来自已知均数的总体。本并非来自已知均数的总体。单样本设计单样本设计t t检验的步骤检验的步骤例例4测得测得25例女性患者的血红蛋白(例女性患者的血红蛋白(Hb),其均数为其均数为150(g/L),标准差标准差为为16.5(g/L)。而当地正常成年女性的而当地正常成年女性的Hb均数为均数为132(g/L),问该病问该病女
20、性患者的女性患者的Hb含量是否与正常女性含量是否与正常女性Hb含量不同含量不同?1、H0:132,病人与正常人的平均血红蛋白含量相等;H1:132,病人与正常人的平均血红蛋白含量不等。2、检验水准0.053、计算检验统计量 4、按=25-1=24查附表2t界值表 P=P(|t|5.4545)?5、本例P0.05,按=0.05的水准,拒绝H0,接受H1,差别有统计学意义,认为该病女性患者的Hb含量高于正常女性的Hb含量。单样本设计单样本设计检验的适用条件检验的适用条件独立性独立性independence正态性正态性 normality当资料不满足正态性当资料不满足正态性选用单样本设计秩和检验选用
21、单样本设计秩和检验如何判断资料是否服从正态分布如何判断资料是否服从正态分布从经验或专业知识判断从经验或专业知识判断需作正态性检验需作正态性检验配对设计配对设计 t t检验检验u配对设计是研究者为了控制可能存在的主要非配对设计是研究者为了控制可能存在的主要非处理因素而采用的一种试验设计方法。处理因素而采用的一种试验设计方法。u减少了个体差异,配对设计的抽样误差减小,减少了个体差异,配对设计的抽样误差减小,提高了统计效率提高了统计效率。配对设计的形式配对设计的形式配对设计有同体配对和异体配对两种形式配对设计有同体配对和异体配对两种形式同体配对同体配对*自身前后配对自身前后配对对同一受试对象处理前后
22、结果对同一受试对象处理前后结果进行比较进行比较*自身左右配对自身左右配对同一对象接受两种处理,如同一同一对象接受两种处理,如同一标本用两种方法进行检验,同一患者接受两种处理方法;标本用两种方法进行检验,同一患者接受两种处理方法;*自身取样配对自身取样配对比如血样、尿样、唾液等比如血样、尿样、唾液等异体配对异体配对将受试对象(按主要非处理因素)配成特征相近将受试对象(按主要非处理因素)配成特征相近的对子,同对的两个受试对象随机接受两种不同的处理。的对子,同对的两个受试对象随机接受两种不同的处理。实验动物按同种属,性别相同,年龄、体重相近的两个动物配成实验动物按同种属,性别相同,年龄、体重相近的两
23、个动物配成对子。对子。人群试验中,将性别相同,年龄、生活、劳动条件相近的两个人人群试验中,将性别相同,年龄、生活、劳动条件相近的两个人配成对子或同一批病人治疗前后的某项生理、生化指标进行测量观配成对子或同一批病人治疗前后的某项生理、生化指标进行测量观察。察。例例1某医生研究脑缺氧对脑组织中生化指标的影响,将某医生研究脑缺氧对脑组织中生化指标的影响,将白兔按出生体重配成白兔按出生体重配成7对,一组为对照组,一组为脑缺氧对,一组为对照组,一组为脑缺氧模型组。试比较两组动物脑组织钙泵的含量有无差别?模型组。试比较两组动物脑组织钙泵的含量有无差别?白兔编白兔编号号1234567对照组对照组0.3550
24、0.20000.31300.36300.35440.34500.3050试验组试验组0.27550.25450.18000.32300.31130.29550.2870差值差值0.0795-0.05450.13300.04000.04310.04950.0180 例例2为了研究孪生兄弟的出生体重是否与其出生顺序有为了研究孪生兄弟的出生体重是否与其出生顺序有关,共收集了关,共收集了15对孪生兄弟的出生顺序和出生体重,数对孪生兄弟的出生顺序和出生体重,数据如下:据如下:编号编号123456789101112131415先出先出生生2.793.062.343.413.483.232.272.483.
25、033.073.612.693.092.982.65后出后出生生2.692.892.243.373.502.932.242.552.823.053.582.663.202.922.60差值差值0.100.170.100.04-0.020.300.03-0.070.210.020.030.03-0.110.060.05 例例3现用两种测量肺活量的仪器对现用两种测量肺活量的仪器对12名妇女测得最大呼名妇女测得最大呼气率(气率(PEER)(L/min),资料如下表,问两种方法的检测资料如下表,问两种方法的检测结果有无差别?结果有无差别?编号编号123456789101112Wright法法49039
26、7512401470415431429420275165421Mini法法525415508444500460390432420227268443差值差值3518-4433045-4130-4810322配对配对t t检验检验配对配对t 检验实质同单样本检验实质同单样本t 检验。检验。对每对数据的差值进行检验,若两处理效应相同,即对每对数据的差值进行检验,若两处理效应相同,即 1=2,则,则 d 1 2=0差值的样本均数差值的样本均数 与已知总体均数与已知总体均数 d=0的比较的比较配对设计配对设计检验可解决的问题检验可解决的问题?配对设计配对设计检验的假设检验步骤检验的假设检验步骤 1、H0
27、:d=0H1:d0 2、0.05 3、4、查、查=n-1的的界值表,确定界值表,确定值值 5、P拒绝拒绝H0,接受接受H1 P不能拒绝不能拒绝H0 例例例例4 204 20只按体重、月龄及性别配对的大白鼠随机分入只按体重、月龄及性别配对的大白鼠随机分入只按体重、月龄及性别配对的大白鼠随机分入只按体重、月龄及性别配对的大白鼠随机分入甲、乙两组,甲组饲喂正常饲料,乙组的饲料缺乏维生甲、乙两组,甲组饲喂正常饲料,乙组的饲料缺乏维生甲、乙两组,甲组饲喂正常饲料,乙组的饲料缺乏维生甲、乙两组,甲组饲喂正常饲料,乙组的饲料缺乏维生素素素素E E。1010天后测定各鼠肝脏的维生素天后测定各鼠肝脏的维生素天后
28、测定各鼠肝脏的维生素天后测定各鼠肝脏的维生素A A含量,结果如下。含量,结果如下。含量,结果如下。含量,结果如下。问两组大白鼠肝脏维生素问两组大白鼠肝脏维生素问两组大白鼠肝脏维生素问两组大白鼠肝脏维生素A A含量是否有差别?含量是否有差别?含量是否有差别?含量是否有差别?例例 5 5 现用两种测量肺活量的仪器对现用两种测量肺活量的仪器对12 12名妇女测得最大呼气率名妇女测得最大呼气率(PEER)(L/min),资料如表,资料如表6.16.1,问两种方法的检测结果有无差别,问两种方法的检测结果有无差别?H0:d0,两仪器检验结果相同;,两仪器检验结果相同;H1:d0,两仪器检验结果不同。,两仪
29、器检验结果不同。双侧双侧 =0.05 按按 =n-1=12-1=11查查 t值值 表表,得得 t0.20,11=1.363,t0.10,11=1.796,t0.10,11tt0.20,11,则则0.20P0.10,差差别别无无统统计计学学意意义义,尚尚不不能能认认为为两两种种仪仪器器检检查查的的结结果果不不同。同。*独立性独立性*正态性正态性当资料不满足正态性当资料不满足正态性选用配对设计秩和选用配对设计秩和检验检验配对设计配对设计检验的适用条件检验的适用条件两独立样本两独立样本t t检验检验又称为成组又称为成组t t检验或完全随机设计两样本检验或完全随机设计两样本t t检验,是指分别从两个研
30、究总体中随机抽检验,是指分别从两个研究总体中随机抽取样本,目的是推断这两个独立样本所代取样本,目的是推断这两个独立样本所代表的未知总体均数表的未知总体均数 1 1和和 2 2是否相等是否相等两独立样本两独立样本t t检验检验有些研究设计既不能作自身对比,也不便于配对。如有些研究设计既不能作自身对比,也不便于配对。如实实验验中中只只有有把把受受试试动动物物杀杀死死后后才才能能获获得得所所需需数数据据,则则不可能对动物在处理前后各进行一次测定;不可能对动物在处理前后各进行一次测定;再再如如比比较较两两种种治治疗疗方方法法对对同同一一疾疾病病的的疗疗效效,每每个个患患者者一一般般只只能能接接受受一一
31、种种方方法法的的治治疗疗,把把受受试试患患者者配配成成若若干干对对在在实实际际工工作作中中又又非非常常困困难难,这这时时只只能能进进行行两两组组间间均均数的比较。数的比较。在在两两组组比比较较的的资资料料中中,每每个个观观察察对对象象都都应应按按照照随随机机的的原原则则进进行行分分组组,两两组组样样本本量量可可以以相相等等,也也可可以以不不等等,但只有在两组例数相等时检验效率才最高。但只有在两组例数相等时检验效率才最高。完全随机设计类型(两种形式)完全随机设计类型(两种形式)1.1.从同一个总体中随机抽取两个样本,分别采用从同一个总体中随机抽取两个样本,分别采用两种不同的处理,比较不同处理结果
32、是否有差两种不同的处理,比较不同处理结果是否有差异。异。2.2.从两个总体中随机抽取两个样本,两样本信息从两个总体中随机抽取两个样本,两样本信息不同,推断两总体信息是否不同不同,推断两总体信息是否不同。例某医院用某新药与常规药治疗婴幼儿贫血,将例某医院用某新药与常规药治疗婴幼儿贫血,将2020名贫名贫血患儿随机等分两组,分别接受两种药物治疗,测得血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量血红蛋白增加量(g/L)(g/L)如下,问新药与常规药的疗效有如下,问新药与常规药的疗效有无差别?无差别?新药新药组组24362514263423201519常规常规药组药组141820152
33、22421252723例某市于例某市于19731973年和年和19931993年抽查部分年抽查部分1212岁男童对其生长岁男童对其生长发育情况进行评估,其中身高的有关资料如下,试比较发育情况进行评估,其中身高的有关资料如下,试比较这两个年度这两个年度1212岁男童身高均数有无差别。岁男童身高均数有无差别。19731973年:年:120120均数均数139.9 cm 139.9 cm 标准差标准差7.5 cm7.5 cm19931993年:年:153153均数均数143.7 cm 143.7 cm 标准差标准差6.3 cm6.3 cm完全随机设计完全随机设计检验可解决的问题检验可解决的问题?完全
34、随机设计完全随机设计检验的适用条件检验的适用条件独立性独立性正态性正态性方差齐性方差齐性(equal variances):两样本来自的两总体方差相等两样本来自的两总体方差相等方差齐性判断:方差齐性判断:经验判断经验判断作方差齐性检验作方差齐性检验完全随机设计两组比较假设检验分析思路完全随机设计两组比较假设检验分析思路先作方差齐性检验先作方差齐性检验检验检验方差齐方差齐方差不齐方差不齐变量变换变量变换秩和检验秩和检验两样本方差的齐性检验两样本方差的齐性检验适用条件:两样本来自正态分布总体适用条件:两样本来自正态分布总体推断目的:推断两总体方差推断目的:推断两总体方差 和和 有无差别有无差别?方
35、差齐性检验步骤方差齐性检验步骤1、H0:,H1:,=0.05 2、式中式中和和分别为较大和较小的方差,分别为较大和较小的方差,和和分别为方分别为方差较大和较小样本的样本含量。差较大和较小样本的样本含量。3、根据计算得的统计量,查界值表(方差齐性检验用),、根据计算得的统计量,查界值表(方差齐性检验用),作出推断作出推断。完全随机设计完全随机设计检验的假设检验步骤检验的假设检验步骤H0:1=2,H1:120.05计算检验统计量计算检验统计量t值值 两总体方差相等,可将两样本方差合并,求两者的共同两总体方差相等,可将两样本方差合并,求两者的共同方差方差 合并方差合并方差 。完全随机设计完全随机设计
36、检验的假设检验步骤检验的假设检验步骤确定确定P值,作出统计推断值,作出统计推断例例 为研究国产四类新药阿卡波糖胶囊降血糖效果,某为研究国产四类新药阿卡波糖胶囊降血糖效果,某医院用医院用4040名名IIII型糖尿病病人进行同期随机对照试验。型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组试验者将这些病人随机等分到试验组(用阿卡波糖胶用阿卡波糖胶囊囊)和对照组和对照组(用拜唐苹胶囊用拜唐苹胶囊),分别测得试验开始前,分别测得试验开始前和和8 8周后空腹血糖,算得空腹血糖下降值见下表,能周后空腹血糖,算得空腹血糖下降值见下表,能否认为国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空否认为国
37、产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?腹血糖的降糖效果不同?(1)建立检验假设,确定检验水准建立检验假设,确定检验水准H0:1=2 H1:1 2 =0.05(2)计算检验统计量计算检验统计量 =n1+n2 2=2(n 1)=2(20 1)=38(3)确定确定P值,作出推断结论值,作出推断结论 按按=0.05 水准,不拒绝水准,不拒绝H0,无统计学意义。还不能认为阿卡波糖,无统计学意义。还不能认为阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同。胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同。t检验检验总体方差不相等总体方差不相等数据变换后进行数据变换后进行t 检验检验秩转换的非
38、参数检验秩转换的非参数检验近似近似t检验检验 t检验检验 (separate variance estimation t-test)见书见书104104页例题页例题两独立样本几何均数比较的两独立样本几何均数比较的t t检验检验变量变换变量变换检验目的:两样本代表的两总体几何均数有无差别检验目的:两样本代表的两总体几何均数有无差别例:为研究甲乙两种麻疹疫苗预防接种效果,随机分为两组的对例:为研究甲乙两种麻疹疫苗预防接种效果,随机分为两组的对象分别用甲乙两种麻疹疫苗作预防接种,接种后在两组随机抽查,象分别用甲乙两种麻疹疫苗作预防接种,接种后在两组随机抽查,得到儿童注射疫苗后血凝抑制抗体效价(倒数)
39、资料如下,问甲得到儿童注射疫苗后血凝抑制抗体效价(倒数)资料如下,问甲乙两组疫苗预防接种效果(平均效价)是否相同?乙两组疫苗预防接种效果(平均效价)是否相同?组别组别抗体效价倒数抗体效价倒数合计合计510204080160320甲组甲组022861120乙组乙组110161021040甲组甲组20对数均数对数均数1.6773对数标准差对数标准差0.3628乙组乙组40对数均数对数均数1.3387对数标准差对数标准差0.3063小结定量资料三种不同设计类型小结定量资料三种不同设计类型检验比较检验比较 区别区别单样本设计单样本设计配对设计配对设计成组设计成组设计设计形式设计形式解决的问题解决的问题
40、建立假设建立假设统计量统计量自由度计算自由度计算前提条件前提条件不满足条件不满足条件,可采用方法可采用方法第七节第七节 假设检验的两类错误和注意事项假设检验的两类错误和注意事项假设检验的两类错误假设检验的两类错误假设检验的注意事项假设检验的注意事项一、假设检验的两类错误一、假设检验的两类错误假设检验是根据有限的样本信息对总假设检验是根据有限的样本信息对总体作推断,由于存在抽样误差,不论做出体作推断,由于存在抽样误差,不论做出那种推断结论,都有可能发生错误。那种推断结论,都有可能发生错误。一、假设检验的两类错误一、假设检验的两类错误第第类错误与第类错误与第类错误的概念类错误的概念将假设检验的结果
41、与实际情况相比:将假设检验的结果与实际情况相比:第第类错误类错误(typeerror):H0为真时为真时,拒绝,拒绝H0(弃真)(弃真)第第类错误类错误(type error):H0不真时不真时,不拒绝,不拒绝H0(存伪)(存伪)一、假设检验的两类错误一、假设检验的两类错误两者的关系两者的关系第一类错误的概率用第一类错误的概率用表示,假设检验时,根表示,假设检验时,根据研究者的要求来确定,一般取据研究者的要求来确定,一般取0.05或或0.01;第二类错误的概率用第二类错误的概率用表示,它只有与特定的表示,它只有与特定的 H1结合起来才有意义,但结合起来才有意义,但值的大小很难确切估值的大小很难
42、确切估计,仅知样本含量确定时,计,仅知样本含量确定时,愈小,愈小,愈大。愈大。实际中可以通过调整实际中可以通过调整来控制来控制推断结论和两类错误推断结论和两类错误实际情况实际情况检验结果检验结果拒绝拒绝H0不拒绝不拒绝H0H0成立成立第第类错误类错误()结论正确结论正确(1-)H0 不成立不成立结论正确结论正确(1-)第第类错误类错误()与与关系示意图关系示意图 与与 间关系:间关系:大,大,小;小;大,大,小。增加小。增加n可同时可同时,缩小。缩小。图图 健康人与肝病病人的肝大指数分布健康人与肝病病人的肝大指数分布(所拟合的两个正态曲线各按(所拟合的两个正态曲线各按100%面积绘制)面积绘制
43、)肝肝 大大 指指 数数健康人健康人H0肝病病人肝病病人H1第一类错误第一类错误 误诊率误诊率(假阳性率假阳性率)第二类错误第二类错误 漏诊率漏诊率(假阴性率假阴性率)6.1 7.0 8.456891011 4 与与 间关系:间关系:大,大,小;小;大,大,小。增加小。增加n可同时可同时,缩小。缩小。假设检验的功效假设检验的功效检验效能:又称把握度,用检验效能:又称把握度,用1-表示。表示。1-是指两总体确有差别,按是指两总体确有差别,按水准能水准能发现差别的能力。发现差别的能力。比如比如:1-0.90,意味着如果两总体确有差别意味着如果两总体确有差别,则则理论上理论上100次检验中次检验中,
44、有有90次能够得出差异有统计次能够得出差异有统计学意义的结论学意义的结论减少减少I型错误型错误的主要方法:假设检验时设定的主要方法:假设检验时设定 值值。减少减少II型错误型错误的主要方法:的主要方法:提高提高检验效能检验效能。提高提高检验效能的最有效方法:检验效能的最有效方法:增加样本量增加样本量。如何如何选择合适的样本量:选择合适的样本量:实验设计实验设计。二、假设检验的注意事项二、假设检验的注意事项要有严密的抽样研究设计要有严密的抽样研究设计样本的代表性与组间均衡性样本的代表性与组间均衡性(可比性)可比性)所谓代表性是指该样本从相应总体中经随机抽样获得,能所谓代表性是指该样本从相应总体中
45、经随机抽样获得,能够代表总体的特征;够代表总体的特征;所谓可比性是指各对比组间除了要比较的主要因素外,其所谓可比性是指各对比组间除了要比较的主要因素外,其它影响结果的因素应尽可能相同或相近它影响结果的因素应尽可能相同或相近 为了保证资料的可比性,必须要有严密的实验设计,保证为了保证资料的可比性,必须要有严密的实验设计,保证样本随机抽取于同质总体,这是假设检验得以正确应用的样本随机抽取于同质总体,这是假设检验得以正确应用的前提前提。二、假设检验的注意事项二、假设检验的注意事项根据研究目的、资料类型、设计类型及样本含量大根据研究目的、资料类型、设计类型及样本含量大小选择适当的假设检验方法小选择适当
46、的假设检验方法有统计学意义不等于有实际意义有统计学意义不等于有实际意义 如两组降压药的疗效如两组降压药的疗效结论不能绝对化结论不能绝对化假设检验结论具有概率性,对于有统计学意义的结论,要假设检验结论具有概率性,对于有统计学意义的结论,要考虑考虑型错误,对于无统计学意义的结论,要考虑型错误,对于无统计学意义的结论,要考虑型错误。型错误。报告结论时,应列出现有统计量,注明单、双侧检验及检报告结论时,应列出现有统计量,注明单、双侧检验及检验水准,并写出验水准,并写出P P值的确切范围。值的确切范围。假设检验与可信区间的区别与联系假设检验与可信区间的区别与联系可信区间用于推断总体参数所在的范围,假设检
47、可信区间用于推断总体参数所在的范围,假设检验用于推断总体参数是否不同验用于推断总体参数是否不同可信区间具有假设检验的主要功能;可信区间具有假设检验的主要功能;可信区间可以提供假设检验没有的信息(可信区可信区间可以提供假设检验没有的信息(可信区间在回答差别有无统计学意义的同时,还可以提间在回答差别有无统计学意义的同时,还可以提示差别有无实际意义);示差别有无实际意义);可信区间可以提供的信息可信区间可以提供的信息假设检验与可信区间的区别与联系假设检验与可信区间的区别与联系假设检验可提供可信区间不提供的信息假设检验可提供可信区间不提供的信息当统计结论为拒绝当统计结论为拒绝H0时,假设检验可以报告确
48、切的时,假设检验可以报告确切的P值,说明检验结论的概率保证;值,说明检验结论的概率保证;当统计结论为不拒绝当统计结论为不拒绝H0时,假设检验可以对检验功效时,假设检验可以对检验功效做出估计。做出估计。可信区间只能在预先规定的概率可信区间只能在预先规定的概率前提下进行计前提下进行计算,而假设检验能够获得确切的概率算,而假设检验能够获得确切的概率P值。值。假设检验与可信区间的区别与联系假设检验与可信区间的区别与联系总之,置信区间与相应的假设检验既能总之,置信区间与相应的假设检验既能提供等价信息,又各自有不同的功能,两提供等价信息,又各自有不同的功能,两者结合起来,可以提供更全面更完整的信者结合起来
49、,可以提供更全面更完整的信息息练习练习 10例男性矽肺患者的血红蛋白(例男性矽肺患者的血红蛋白(g/dl)的均数为的均数为12.59(g/dl),标准差为),标准差为1.63(g/dl),已知男性健康成人的血红蛋白),已知男性健康成人的血红蛋白正常值为正常值为14.02(g/dl),问矽肺患者的血红),问矽肺患者的血红蛋白是否与健康人不同蛋白是否与健康人不同(分别用分别用可信区间估计可信区间估计和假设检验和假设检验说明说明)。本例自由度本例自由度=10-1=9=10-1=9,经查表得,经查表得t t0.05,90.05,9=2.262=2.262,则,则矽矽肺肺患患者者的的血血红红蛋蛋白白总总
50、体体均均数数的的95%CI:(11.424,13.756)g/dl95%CI:(11.424,13.756)g/dl,不不包包括括男男性性健健康康成成人人的的血血红红蛋蛋白白的的总总体体均均数数14.0214.02(mg/dlmg/dl),所所以以说说矽矽肺肺患患者者的的血红蛋白与健康人不同。血红蛋白与健康人不同。H0:14.02,矽肺患者的血红蛋白与健康人相同;,矽肺患者的血红蛋白与健康人相同;H1:14.02,矽肺患者的血红蛋白与健康人不同。,矽肺患者的血红蛋白与健康人不同。=0.05 t t t t0.05,90.05,9=2.262 =2.262 P P 0.050.05 按按 =0.