《假设检验基础研.pptx》由会员分享,可在线阅读,更多相关《假设检验基础研.pptx(70页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、引子:1.医学科学研究的特点 医学统计学的任务普 查:直接得到关于总体的认知,不需要统计推断。抽样调查抽样误差参数估计假设检验风 险第1页/共70页假设检验的基础n 假设检验的基本思想n 假设检验的步骤n 单组样本资料的假设检验 n 假设检验的两类错误n假设检验的几个观点第2页/共70页【例5-1】某一般中学男生的心率平均值0=75次/分,标准差=5.0次/分(大规模调查获得);我们通 过抽样调查,获得经常参加体育锻炼的某中学100名男生的心率平均值为 ;问:经常参加体育锻炼的男生心率是否与一般中学男生的不同?第3页/共70页未知总体第二种可能性:已知总体样本均数与拟比较的总体均数不等有两种可
2、能:抽样误差本质差异运动的影响 n=100第一种可能性:第4页/共70页唯证据原则反证法没有差异 假设检验作检验 无罪假设 刑事诉讼找证据 假设检验实质是反证法与概率学小概率理论的一个完美结合第5页/共70页什么是假设检验?假设:先预设一种立场,是对总体参数的数值所作的一种陈述例:认为经常参加体育锻炼的男生心率与一般中学男生的没有差异,即1=;其实质是将样本统计量 与已知总体均数之间差异的原因归结为抽样误差。检验:是一种方法,它一定是利用样本提供的信息,从概率的角度来判断这个假设是正确的(是抽样误造成的)?还是错误的(不是抽样误差造成的)?下结论第6页/共70页H0:零假设t 界值t 分布图,
3、=25/2/2/2/2-t 界值根据P 值,得出结论H1:备择假设验证假设建立假设下结论检验统计量预设=0.05P 值三个重要概念:n 检验水准n 检验统计量n 概率P值第7页/共70页3.概率P 值:就是根据抽样分布的规律,由H0所规定的总体中作一次随机抽样,实际中得到目前这个样本,甚至包括比这个更偏、更极端样本的累积可能性。换言之:在H0 成立的前提下,出现目前检验统计量及更不利于H0成立的统计量的累积概率,也就是H0成立的概率。假设检验的 P 值PP-t 界值t 界值P 第10页/共70页关于假设检验的几个观点 根据P 值下结论:n当P 时,则结论为:按检验水准拒绝 H0,接受 H1,认
4、为差异有统计学意义(统计结论),可认为不同或*取值高于#的(专业结论);n当P 时,则结论为:按检验水准不拒绝H0,认为差异无统计学意义(统计结论),还不能认为不同或*取值高于#(专业结论)。“不拒绝H0”只因为此时拒绝H0的证据不足,绝不等同于接受H0。所以下结论时对H0只能说“拒绝”或“不拒绝”,而对H1只能说“接受”。第11页/共70页5.2 假设检验的步骤第13页/共70页建立假设,确定检验水准及单双侧确定P值计算检验统计量作推断结论拒绝H0,接受H1,认为差异有统计学意义P PP P 不拒绝H0,认为差异无统计学意义假设检验的步骤:第14页/共70页u 建立假设H0、H1 u 确定检
5、验水准u 根据专业知识,确定单、双侧检验建立假设检验,确定检验水准:第15页/共70页 什么是零假设(Null Hypothesis)?(1)一般是作没有差别的假设,又称“原假设”或“无效假设”,表示为 H0,即 H0:=某一数值,如=0(2)该假设将差异的原因归结为抽样误差1.建立假设:提出无效假设和备择假设第16页/共70页 什么是备择假设(Alternative Hypothesis)?(1)与无效假设相对立有差别的假设,由不等号,或 组成,常表示为 H1;即 H1:某一数值;或 某一数值,某一数值。(2)该假设将差异的原因归结为环境因素,或是一种本质差异。第17页/共70页 2.确定检
6、验水准 由研究者事先确定。表示为,常用的 值有0.01、0.05;是一个概率值,假设原假设为真时,拒绝原假设的概率,又被称为抽样分布的拒绝域。注意:第18页/共70页3.根据数据特征和专业知识,确定单、双侧t t 临界值临界值-t t 临界值临界值问:经常参加锻炼的男生与一般男生心率有何不同?双侧检验:用于推断两总体有无差别时,对两总体间可能存在的两种位置关系均要考虑在内。拒绝域拒绝域拒绝域拒绝域 /2/2/2 /2/2 接受域接受域接受域1-1-1-第19页/共70页t t 临界值临界值问:经常参加锻炼的男生是否低于一般男生的?拒绝域拒绝域接受域接受域接受域1-1-1-2.单侧检验:用于推断
7、两总体有无差别时,仅考虑两总体间可能存在的两种位置关系的一种。第20页/共70页n 一般情况下,如结果不明确时,采用双侧假设 H1:某一数值,如0(双侧,包括0和0 两方面)n如果从专业上能肯定其中一侧是不可能的,则采用单侧对立假设 H1:某一数值;如0(左单侧)H1:某一数值;如0(右单侧)单侧、双侧检验的描述方法:第21页/共70页选择检验方法和计算检验统计量:1.假设检验方法的选择:即检验统计量的选择。要依据以下内容,选择最适当的假设检验方法(检验统计量)。u 分析目的u 数据类型u 研究设计方案u 假设检验方法应用的前提条件第22页/共70页分析目的 各种分布的点与区间的参数 生存率、
8、寿命表的分布拟合单果变量估计性分析 随机区组/析因/交叉/重复测量/正交 及其它设计的协方差分析 Hotelling T2检验 定量:t/Z检验、方差分析、秩和检验 定性:检验、秩和检验、对比性分析多因单果单因多果单因单果 简单线性相关/回归、秩相关、列联相关 曲线相关(曲线拟和)时间序列分析、数列升降趋势分析 多重线性相关/回归、Logistic、Cox回归 判别分析 典型相关、因子分析、复相关、偏相关相关回归分析趋势性分析多因单果单因多果单因单果多果聚积性分析 聚类分析、主成分分析、通径分析 多元参考值 评分、指数秩和比、层次模型、Topsis法 Meta分析综合评价分析单果或多果 Kap
9、pa分析、协调系数协调性分析第23页/共70页有关样本资料的差异性检验定量资料数据类型前提条件t/Z检验四格表 RC表配对四格表设计类型单样本两独立样本配对设计多独立样本方差分析两组二分类配对设计多组多分类单样本两多独立样本配对设计不满足t 检验/方差分析条件的等级资料设计类型定性资料设计类型 检验秩和检验随机区组资料析因设计资料重复测量资料前提条件前提条件第24页/共70页2.计算检验统计量:各检验方法都有其相应的检验统计量,不同的检验统计量通常都依据于其特定的抽样分布。举例:变量数值变量1.单样本、配对、两样本资料(来自正态分布总体)t/u检验(t 值)t/u分布2.多组样本资料 方差分析
10、(F 值)F分布3.方差齐性检验 F 值 F分布分类变量第25页/共70页根据检验统计量的结果作出统计推断:在两个对立的检验假设间二取一的规则是:(1)若 P ,意味着在H0成立的前提下不大可能发生当前,或是更不利的状况 拒绝 (2)若 P,意味着在H0成立的前提下,发生当前状况或是更不利的状况的可能性还是比较大的 不拒绝95%95%t 分布图S-XXt=2.5%2.5%t 临界值第26页/共70页5.3 单组样本资料的假设检验第28页/共70页变量变换或秩和检验t 检验变量变换或秩和检验例数n=50正态偏态u 检验u 检验两独立样本假设检验单样本配对资料差值正态偏态对子数t 检验n=50例数
11、正态偏态n 50方差不齐方差不齐方差齐方差齐变量变换或秩和检验t 检验t 检验第29页/共70页【例5-1】某一般中学男生的心率平均值0=75次/分,标准差=5.0次/分(大规模调查获得);我们通 过抽样调查,获得经常参加体育锻炼的某中学100名男生的心率平均值为 ;问:经常参加体育锻炼的男生心率是否与一般中学男生的不同?第30页/共70页【案例解析】n 研究目的:差异性比较n 资料类型:定量资料n 设计类型:单样本设计单样本资料Z检验 总体标准差已知,=5.0H0:=0H1:0=0.05第31页/共70页统计结论:已知 Z(0.05/2)=1.96,则 P 2000时,结果以Kolmogor
12、ov-Smirnov(D检验)为准第37页/共70页2.单组样本均数 t 检验:第38页/共70页结果输出:两总体均数差及95%CI用于比较的已知总体均数第39页/共70页5.4 假设检验的两类错误和检验功效第42页/共70页 假设检验是统计推的重要内容,它是应用数学上的反证法和小概率事件实际推断原则,根据样本 统计量对总体作出推断,结论具有概率性。结论的风险性两类错误第43页/共70页I 类错误类错误(type I error)弃真:弃真:I 类 错误示意图(以单侧 t 检验为例)t t ta a 临界值临界值临界值H H0 0:m m=m m 0 0正常人正常人1-1-m m 0 0误诊(
13、假阳性)实事:H0 为真第44页/共70页 II型错误示意图(以单侧 t 检验为例)t t ta a 临界值临界值临界值H H0 0:m m=m m 0 0正常人正常人1-1-m m 0 0H H1 1:m m m m 0 0病人1-m m 1 1漏诊(假阴性)II 类错误类错误(type II error)存伪存伪存伪存伪:实事:H0 为假,H1 为真检验功效第45页/共70页假设检验中的两类错误:两类错误的意义两类错误的意义真实情况真实情况根据样本,作假设检验下的结论根据样本,作假设检验下的结论不拒绝不拒绝H0拒绝拒绝H0H0为真为真推断正确推断正确I 类错误类错误犯错误的概率是犯错误的概
14、率是a a,即检验水准,即检验水准H0为假为假II类错误类错误犯错误的概率是犯错误的概率是b b推断正确推断正确 正确的概率是正确的概率是1-b b,即检验功效即检验功效1.第一类错误(弃真错误)拒绝了实际上存在的H0第一类错误的概率为 2.第二类错误(纳伪错误)不拒绝实际上不存在的H0第二类错误的概率为 第46页/共70页n定义:通常把1-,即拒绝不正确H0的概率称为检验功效,也称把握度。n 意义是:当两个总体确有差别时,按所规定的检验水准的水平,能发现这种差异的能力。如1-=0.80,理论上100次抽样检验中,平均有80次能够得出差别有统计学意义的结论。n一般情况下要求1-在0.80以上。
15、检验功效(power of test)第47页/共70页 由于所建立的检验主要是控制犯I类错误的概率,而对犯II类错误的概率却无法直接控制,即对一个检验犯II类错误的概率究竟怎样无所而知。要谨慎对待“不拒绝H0”的结论 即“阴性结果”第48页/共70页 因此,Power值的大小已成为某些国际会议审查论文设计内容之一;有的已明确规定,若研究者根据P0.05下阴性结论时,必须提供Power值。第49页/共70页PASS(power analysis and sample size)是Jerry开发的专业样本含量估算和效能分析软件。PASS可以对均数间的比较、方差分析、相关和回归分析、计数资料的假设
16、检验和病例随访资料分析等检验条件下的检验效能和样本含量进行估计。第56页/共70页小小 结结假设检验是依据样本提供的有限信息对总体做推断的过程。假设检验的步骤为:建立假设计算统计量确定p值,作出推断结论假设检验的基本思想是根据小概率的原理,认为“小概率事件在一次抽样中不太可能出现”。假设检验中无论拒绝不拒绝H0,都有可能犯错误(类错误和类错误)。假设检验的推断结果下结论时不能绝对化,并要结合专业知识。第57页/共70页案例分析:见教材案例分析:见教材P89案例案例1、案例案例2见每章后:常见疑问见每章后:常见疑问第59页/共70页案例辨析案例辨析1:为了比较一种新药与常规药治疗高血压的为了比较
17、一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单疗效,以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的检验,随机抽取组设计定量资料均数比较的检验,随机抽取25名患者服用了新药,以常规药的疗效均值为,名患者服用了新药,以常规药的疗效均值为,进行检验,无效假设是,对立假设是,检验水进行检验,无效假设是,对立假设是,检验水平平=1%。结果值很大,拒绝了无效假设。结果值很大,拒绝了无效假设。“拒绝了无效假设拒绝了无效假设”意味着什么?下面的说法你意味着什么?下面的说法你认为对吗?认为对吗?第60页/共70页说法:(1)你绝对否定了总体均数相等的无效假设。(2)你得到了无效
18、假设为真的概率是1%。(3)你绝对证明了总体均数不等的备择假设。(4)你能够推论备择假设为真的概率是99%。(5)如果你决定拒绝无效假设,你知道你将犯错误的概率是1%。(6)你得到了一个可靠的发现,假定重复这个实验许多次,你将有99%的机会得到具有统计学意义的结果。?第61页/共70页最佳选择题:1.统计推断的内容是:A用样本指标推断总体指标 B检验统计上的“假设”CA、B均不是 DA、B均是2.两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小:Aa a=0.05 Ba a=0.01 Ca a=0.10 Da a=0.20第62页/共70页3.关于假设检验,下列那一项说法是正确的:
19、A单侧检验优于双侧检验B采用配对t检验还是两独立样本t 检验是由实验 设计方法决定的C检验结果若P值大于0.05,则接受H0犯错误的可 能性很小D用t 检验进行两样本总体均数比较时,不要求方 差齐性第63页/共70页简答题:简答题:1.什么是一类错误?什么是二类错误?二者之间有什么关系?2.P 与有什么区别和联系?3.既然假设检验的结论有可能有错,为什么还要进行假设检验?第64页/共70页答案:答案:P值的大小和没有必然关系。3.P是指H0成立的前提下,出现目前样本数据对应的统计量数值乃至比它更极端数值的概率。是事先确定的检验水准。第65页/共70页4.假设检验中,无论拒绝不拒绝H0,都可能会犯错误:表现为拒绝H0时,会犯第一类错误,不拒绝H0时,会犯第二类错误,但这并不能否认假 设 检 验 的 作 用。.因为只要涉及到抽样,就会有抽样误差的存在,因此就需要进行假设检验。.只是要注意假设检验的结论只是个概率性的结论,它的理论基础是“小概率事件不太可能原理”。.第66页/共70页练习题:第67页/共70页提 问:第68页/共70页THANK YOU!第69页/共70页感谢您的观看。第70页/共70页