《均值假设检验PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《均值假设检验PPT讲稿.ppt(55页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、均值假设检验第1页,共55页,编辑于2022年,星期六2 1.假设检验的本质The Nature of Hypothesis Testing第2页,共55页,编辑于2022年,星期六3假设(hypothesis)关于某事为真的陈述:每包xx饼干的平均重量与包装袋上记载的454 g 不同排课时间影响选修统计学同学的成绩表现姚明本周的表现是否失常一种新药的临床实验表现要好到什么程度才能说它不是安慰剂第3页,共55页,编辑于2022年,星期六4然而统计假设实际上包含两部分,零与备择假设(Null and Alternative Hypotheses)零假设(Null Hypotheses):被检验的
2、假设。我们使用符号H0来表示零假设。H0:=0备择假设(Alternative Hypotheses):与零假设形成对立的假设,使用符号 H0 或 H1 来表示对立假设。Ha:0,双侧,双尾检验(two-tailed test)Ha:0,右侧(right-tailed test),单侧或单尾检验(one-tailed test)Ha:0,左侧(left-tailed test),单侧或单尾检验(one-tailed test)第4页,共55页,编辑于2022年,星期六5假设检验之逻辑(The Logic of Hypothesis Testing)先假设零假设为真,自总体取一随机样本,倘若样本
3、资料与零假设一致,则不拒绝零假设;倘若样本资料与零假设不一致(且其方向与备择假设一致),则拒绝零假设,并结论备择假设为真。何谓与零假设(不)一致?-需订出具体标准。有时我们也说接受零假设,但这并不准确。就像打官司的时候,我们说某人无罪,是应为无法证明其有罪,不利于被告的证据不足以采信。所以,准确的说法是无法拒绝零假设。第5页,共55页,编辑于2022年,星期六6样本25袋脆饼中95.44%的平均重量落在的2个标准差(3.12g)之间。第6页,共55页,编辑于2022年,星期六7(a)拒绝零假设的诀策准则;(b)若零假设为真,将拒绝零假设的诀策准则套上 的正态曲线。第7页,共55页,编辑于202
4、2年,星期六8图示样本平均数(450g)距离零假设中的总体平均数(454g)的相对位置(以标准差为单位)。第8页,共55页,编辑于2022年,星期六92.专有名词,误差及假设Terms,Errors,and Hypotheses第9页,共55页,编辑于2022年,星期六10检验统计量,拒绝区,非拒绝区,临界值(Test Statistic,Rejection Region,Nonrejection Region,Critical Values)检验统计量(检验统计量(Test StatisticTest Statistic):为了检验是否拒绝零假设时所计算的统计数。拒绝区(拒绝区(Reject
5、ion RegionRejection Region):可以拒绝零假设的检验统计量之区间。非拒绝区(非拒绝区(Nonrejection RegionNonrejection Region):无法拒绝零假设的检验统计量之区间。临界值(临界值(Critical ValuesCritical Values):区隔拒绝区与非拒绝区的检验统计量之值。临界值被视为拒绝区的一部分。第10页,共55页,编辑于2022年,星期六11第11页,共55页,编辑于2022年,星期六12图示双尾拒绝区、左尾拒绝区及右尾拒绝区。第12页,共55页,编辑于2022年,星期六13 3.当已知,一个总体平均数的假设检验Hypo
6、theses Tests for One Population Mean When is Known第13页,共55页,编辑于2022年,星期六14取得临界值(Obtaining Critical Values)若假设检验依照显著性水平来进行,则所选取的临界值应可满足,若零假设为真,检验统计量落入拒绝区的机率为。第14页,共55页,编辑于2022年,星期六15当该检验为:(a)双尾,(b)左尾,(c)右尾,则假设检验在显著性水平下的临界值位置。常用的 z:第15页,共55页,编辑于2022年,星期六16总体平均数的单一样本Z检验(临界值法)(The One-Sample z-Test for
7、a Population Mean(Critical-Value Approach)假设:正态总体或大样本。已知。步驟一:零假设为H0:=0,备择假设为或 或(双侧)(左侧)(右侧)步驟二:决定显著性水平。第16页,共55页,编辑于2022年,星期六17步驟三:计算检验统计量步驟四:临界值为 或 或 (双尾)(左尾)(右尾)使用表A-5找出临界值。第17页,共55页,编辑于2022年,星期六18步驟五:若此统计检验量的值落在拒绝区內,则拒绝H0;反之,则无法拒绝H0。步驟六:解释此假设检验的结果。此假设检验在正态总体是精确的,在非正态总体中的大样本中则是趋近于正确的。Statistical v
8、s.practical significance第18页,共55页,编辑于2022年,星期六19使用z检验的时机(When to Use the z-Test)小型样本(样本小于小型样本(样本小于1515):z检验只能用于当总体为正态分布或非常趋近正态时。中型样本(样本介于中型样本(样本介于15153030):除了资料当中有离散值或者总体分布严重偏离正态分布之外,可以使用z检验。大型样本(样本大于大型样本(样本大于3030):在z检验的基本使用上并无限制。然而,若离散值存在且无正当理由将之移除,则应检验离散值的影响。我们需各做一次包含与不含离散值的假设检验,若这两者的结论相同,则可以接受此一结
9、论;否则应采用不同的统计方法或取另一个样本。若有正当理由移除离散值,则可以使用此z检验法。第19页,共55页,编辑于2022年,星期六20P值P-Values第20页,共55页,编辑于2022年,星期六21若零假设H0为真,得到检验统计量的值等于目前的值或比之更极端的机率。称为P值(p-value),observed significance level,probability value。P值越小,越支持备择假设,也就是备择假设成立的证据越強。第21页,共55页,编辑于2022年,星期六22当检验为(a)双尾;(b)左尾;(c)右尾时,Z检验的P值。第22页,共55页,编辑于2022年,星期
10、六23P值代表观测到的显著性水平(observed significance level)假设检验的P值等于可以拒绝零假设的最小显著性水平,那就是說,得以让目前样本资料拒绝H0的最低最小显著性水平。第23页,共55页,编辑于2022年,星期六24使用P值作为假设检验的临界值(Decision Criterion for a Hypothesis Test Using the P-Value)若P值小于或等于显著性水平时,拒绝零假设;反之,则不拒绝零假设。第24页,共55页,编辑于2022年,星期六25总体平均数的单一样本Z检验(P值法)(The One-Sample z-Test for a
11、Population Mean(P-Value Approach)假设:正态总体或大样本。已知。步驟一:零假设为H0:=0,备择假设为或 或(双侧)(左侧)(右侧)步驟二:确定显著水平。第25页,共55页,编辑于2022年,星期六26步驟三:计算检验统计量并标记为z0。步驟四:临界值为 或 或 (双尾)(左尾)(右尾)使用表A-5找出临界值。第26页,共55页,编辑于2022年,星期六27步驟五:若P,则拒绝H0;反之,无法拒绝H0。步驟六:解释此假设检验的结果。此假设检验在正态总体是精确的,在非正态总体中的大样本里则是趋近于正确的。第27页,共55页,编辑于2022年,星期六28临界值法 v
12、s.p值法临界值法临界值法P P值法值法步驟一步驟一:写出零假设及备择假设步驟一步驟一:写出零假设及备择假设步驟二步驟二:确定显著性水平,步驟二步驟二:确定显著性水平,步驟三步驟三:计算统计检验数的值步驟三步驟三:计算统计检验数的值步驟四步驟四:计算临界值步驟四步驟四:计算P值步驟五步驟五:若此统计检验数的值落入拒绝区,拒绝H0;反之,则不拒绝H0步驟五步驟五:若P,拒绝H0;反之,则不拒绝H0步驟六步驟六:解释假设检验的结果步驟六步驟六:解释假设检验的结果第28页,共55页,编辑于2022年,星期六29当未知,一个总体平均数的假设检验Hypotheses Tests for One Popu
13、lation Mean When is Unknown第29页,共55页,编辑于2022年,星期六30当检验为(a)双尾;(b)左尾;(c)右尾时,t检验的P值。但由于t-table不够详尽,t检验的p值只能以区间表示(可用统计软件获得确切值)第30页,共55页,编辑于2022年,星期六31以样本大小为12及统计检验值t=-1.938,来估计左尾t检验的P值。第31页,共55页,编辑于2022年,星期六32以样本大小为25及统计检验值t=-0.895,来估计双尾t检验的P值。第32页,共55页,编辑于2022年,星期六33总体平均数的单一样本t检验(临界值法)(The One-Sample t
14、-Test for a Population Mean(Critical-Value Approach)假设:正态总体/大样本。未知。步驟一:零假设为H0:=0,备择假设为或 或(双侧)(左侧)(右侧)步驟二:确定显著水平。第33页,共55页,编辑于2022年,星期六34步驟三:计算检验统计量步驟四:临界值为 或 或 (双尾)(左尾)(右尾)使用表A-6找出临界值。第34页,共55页,编辑于2022年,星期六35步驟五:若此统计检验量的值落在拒绝区內,则拒绝H0;反之,则无法拒绝H0。步驟六:解释此假设检验的结果。此假设检验在正态总体是精确的,在非正态总体中的大样本里则是趋近于正确的。第35页
15、,共55页,编辑于2022年,星期六36总体平均数的单一样本t检验(P值法)(The One-Sample t-Test for a Population Mean(P-Value Approach)假设:正态总体/大样本。未知。步驟一:零假设为H0:=0,备择假设为或 或(双侧)(左侧)(右侧)步驟二:确定显著性水平。第36页,共55页,编辑于2022年,星期六37步驟三:计算检验统计量并标记为t0。步驟四:临界值为 或 或 (双尾)(左尾)(右尾)使用表A-6找出临界值。第37页,共55页,编辑于2022年,星期六38步驟五:若P,则拒绝H0;反之,无法拒绝H0。步驟六:解释此假设检验的结
16、果。此假设检验在正态总体是精确的,在非正态总体中的大样本里则是趋近于正确的。第38页,共55页,编辑于2022年,星期六397.应该选用何种方法?Which Procedure Should be Used?第39页,共55页,编辑于2022年,星期六40类型假设统计检验数z检验1.正态分布或大样本2.已知t检验1.正态分布/小样本2.未知自由度=(n-1)W检验对称总体W=绝对值排序后,符号为+的加总第40页,共55页,编辑于2022年,星期六41第41页,共55页,编辑于2022年,星期六42对称总体?开始正态总体?大样本?与统计员討论标准差已知?使用单一样本 z检验使用单一样本 t检验使
17、用 Wilcoxon Signed-Rank检验是是是是是是是是否否否否否否否否第42页,共55页,编辑于2022年,星期六Alpha 越大,检验越有说服力?43第43页,共55页,编辑于2022年,星期六44第一型错误及第二型错误(Type and Type Errors)第一类型错误第一类型错误(Type ErrorType Error):当零假设为真时,错误地拒绝零假设。当零假设为真时,错误地拒绝零假设。佘祥林案第二类型错误第二类型错误(Type ErrorType Error):当零假设为伪时,错误地沒有拒绝零假设。当零假设为伪时,错误地沒有拒绝零假设。辛普森案Type I&II er
18、ror第44页,共55页,编辑于2022年,星期六45显著水平(Significance Level)发生第类型错误的机率为,意即在零假设正确时拒绝零假设的机率。也是假设检验时的显著水平(Significance Level)。发生第类型错误的机率,则为。第45页,共55页,编辑于2022年,星期六46第与第类型错误机率之间的关系(Relation Between Type and Type Error Probabilities)理想上,假设检验时第一类型与第二类型错误的机率都应越低越好,但是.样本大小固定时,当显著水平越小时,(虚无假设为伪时,未拒绝虚无假设的机率)越大。为什么?令可错杀三
19、千,不可放走一人?第46页,共55页,编辑于2022年,星期六47假设检验可能的结论(Possible Conclusion for a Hypothesis Test)若零假设被拒绝,我们下结论:备择假设是正确的。若零假设不被拒绝,我们下结论:这些资料无法提供足够的证据来支持备择假设。第47页,共55页,编辑于2022年,星期六48 犯第类型错误的机率;统计功效Type Error Probabilities;Power第48页,共55页,编辑于2022年,星期六49小问题:真实的和期望的的差距和是什么关系?和的关系?样本大小和的关系?第49页,共55页,编辑于2022年,星期六50图示油量
20、里程表的临界值(=0.05,n=30)。第50页,共55页,编辑于2022年,星期六51当每加侖里程数=25.8时,检验犯第类型错误的机率。第51页,共55页,编辑于2022年,星期六52=25.8、25.6、25.3及25.0时第类型错误的机率。第52页,共55页,编辑于2022年,星期六53统计检验力(Power)假设检验中的统计功效是不犯第类型错误的机率,那也就是說,拒绝错误的零假设的机率。我们可以表示为:Power=1-P(Typeerror)=1-假设检验的功效介于0至1之间,它能测量出假设检验察觉错误零假设的能力。若功效近似于0,则此假设检验察觉出错误零假设的能力不佳;若功效近似于1,则假设检验察觉错误零假设的能力极佳。第53页,共55页,编辑于2022年,星期六54实际上,由于的值是未知的,power其实无法计算,可作功效曲线(power curve)以对假设检验的功效有所评估。油量里程表的功效曲线(=0.05,n=30)。第54页,共55页,编辑于2022年,星期六55固定样本大小,降低显著性水平,则增加,power降低。固定显著性水平下,增加样本大小,则可增加统计检验力。第55页,共55页,编辑于2022年,星期六