《统计检验原理与正态性检验.ppt》由会员分享,可在线阅读,更多相关《统计检验原理与正态性检验.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1杨忠海2统计检验原理统计检验原理与与分布正态性检验分布正态性检验3第一节 假设检验概述4一、假设检验的基本原理51.什么是统计学中的假设什么是统计学中的假设?n假设是对总体的某种推断n例:n上市公司2005年平均利润率10%n上市公司2005年资产负债率服从正态分布6什么是假设检验?n假设检验利用样本推断总体n1.提出一对假设,n一个称为零假设或原假设(The Null Hypothesis),记为H0n另一个称为对立假设、备择假设(The Alternative Hypothesis),记为H1n2.从总体中抽取少数个体(一组样本)n3.根据样本判断接受H0还是接受H1(此说法有些不严格,
2、后面进一步解释!)7所提出的一对假设,何者为零假设?所提出的一对假设,何者为零假设?n出于数学上的需要,原假设总是包含等号“=”,例如:H0:3 H0:3H1:3 H1:3n又如:H0:总体服从正态分布 H0:总体不服从正态分布H1:总体不服从正态分布 H1:总体服从正态分布 8假设检验的两类错误n1.第一类错误n否真错误(针对原假设)本来原假设是正确的,却被拒绝。n出现第一类错误的概率记为 n等于显著性水平 Level of Significancen2.第二类错误n存伪错误(针对原假设)本来原假设是错误的,却被接受。n出现第二类错误的概率为 9统计推断结果的四种情形统计推断结果的四种情形实
3、际情况实际情况决策决策H0 为真为真 H0为假为假不拒绝不拒绝H0正确第二类错误()拒绝拒绝H0第一类错误()正确实际情况如何,我们实际是不知道的!10两类此错误(两类此错误(与与 )的逆向关的逆向关系系 不能同时降低两类错误!11假设检验在科学研究方法中的关键作用12(1)观察:确认宽泛观察:确认宽泛的研究范围的研究范围(3)问题界定:问题界定:描述研究描述研究(4)理论框架:理论框架:对变量进行清对变量进行清楚的辨识与归类楚的辨识与归类(5)提出假设提出假设(6)研究设计研究设计(7)资料的收集、资料的收集、分析与解释分析与解释(8)假设检验:假设检验:假假设设是是否否被被验验证?证?研研
4、究究问问题题是是否否得到解答?得到解答?(2)初步资料搜集:初步资料搜集:访谈、文献查阅访谈、文献查阅(9)撰写报告撰写报告(10)提交报告提交报告(11)作出管理作出管理决策决策是是否否13会计研究中的假设举例n此处所说的“研究”不限于学术研究或理论研究,也适用于解决会计实务界出现的问题。n注意:研究假设与统计假设不是一回事!14例1n在研究“资本结构的影响因素”时,可提出以下研究假设:n假设1:资本结构与企业绩效显著相关n假设2:资本结构与企业规模显著相关n假设3:资本结构与企业成长性显著相关15例2:n研究硕士毕业生在企业工作绩效方面与本科毕业生是否有显著差异,可提出如下研究假设:n假设
5、1:硕士毕业生与本科毕业生在工作绩效方面存在显著差异n此类研究通常需要通过问卷方式测量“绩效”16例3:n在研究股权激励对绩效的影响时,提出以下研究假设:n假设1:高管持股越多,工作绩效越高。n假设2:n假设3:17例4:n研究现金股利偏好的影响因素时,提出以下研究假设:n假设1:股权集中度越高,公司越倾向发放现金股利。n假设2:获利能力越强,公司越倾向发放现金股利。n假设3:183.统计检验概述统计检验的基本原理19还记得中学学过的“反证法”吗?n我们不知到“命题A”是否正确,我们先假定它正确,如果由此产生矛盾,那么我们就认为“当初假定命题A正确”是不对的,因而应判定命题A是不成立的。20例
6、:假设检验原理与p-值n为研究某高校“英语统考成绩”,随机抽取20名同学,其考试成绩如下:87,82,80,80,74,82,74,75,86,88,81,86,92,84,88,77,79,79,83,85 已知英语统考成绩服从正态分布,我们关心该校英语统考成绩是否达到84分的优秀标准。n提出如下假设:n H0:84 该校平均成绩不低于84分n H1:84 该校平均成绩低于84分21n考虑以下指标(统计量):其中:X 为样本均值 S为样本标准差n思考:该指标有何特点?H0成立与H1成立时,一般t值有何不同?22n该指标的特点:n当H0成立时,一般t值为正,且较大;n当H1成立时,一般t值为负
7、,且绝对值较大;n如果H0成立,t值不应该太低。tH0成立时H1成立时23n上面的分析可得下面结论:如果我们假定H0成立,在这种情况下,t值不应太低 24t0当原假设成立时当原假设成立时t统计量分布统计量分布0.10-1.33进一步,我们可知,如果原假设成立,进一步,我们可知,如果原假设成立,t小于小于-1.33的概率仅为的概率仅为10%。25n如果我们将发生的可能性只有10%的事件视为“小概率”事件在一次观察中不会遇到,那么我们在一次抽样观察中,不会遇到t小于-1.33这种情况。26n本例中,样本为:n87,82,80,80,74,82,74,75,86,88,81,86,92,84,88,
8、77,79,79,83,85 n样本平均值X为82.1,标准差S为4.98n代入前述公式,可计算出t值:t=-1.70527n这说明,我们做的一次抽样观察中,出现了t小于-1.33这种情况。与前面的分析相矛盾,因此前面假定H0成立出现了问题,因而应拒绝H0,接受H1。28n简要总结:n我们先假定原假设假定原假设H H0 0成立,在这种情况下成立,在这种情况下,t值低于-1.33的可能性只有10%。n如果我们认为发生的可能性只有10%的事件在一次观察中是不会遇到的,那么H H0 0成立成立时,是不会遇到t值低于-1.33的情况。而本例恰恰遇到的这种情况,因此应否定H0,接受H1。(这种情况称为检
9、验的结果是“显著”的原假设显著不成立。)29n我们作出了“拒绝H0,接受H1”的结论。尽管此推断不能保证100%正确,但其出错的可能不超过10%。n前面所说的10%就是所谓的“显著水平”。30思考:n如果有人说,发生的可能性为10%的事件不能视为“小概率”事件,只有此概率低于5%时,才能视为小概率事件。n本例的结论会不会发生变化?31n如果按照上面的思路,我们必须从头重新做一遍分析。n如果我们得到下一张幻灯片的信息,那么我们就可以直接作出回答。32样本统计量的t值t0-1.7050.052当原假设成立时当原假设成立时t统计量分布统计量分布p-值33np-值 提供了更详细的信息n本例中,p-值为
10、0.052,表明:如果显著水平取0.10检验结果为显著,如果显著水平取0.05则检验结果为不显著不显著。当然,如果显著水平取1%,检验更不显著。34如何运用计算机软件进行检验?n所有类型的检验,计算机软件会输出P-值。我们完全依靠P-值进行检验。n通常当P-值较接近0时(通常以10%为界限),我们应拒绝H0,接受H1。否则我们不能拒绝H0。35np-值 在SPSS输出结果通常以“sig.”表示。n利用SPSS的“sig.”输出结果我们可以方便地进行各种类型的检验,而不需要不需要掌握统计量的定义和拒绝域的形式,而且不需要通过查表确定临界值。统计检验变得异常简单!36n例如:某检验,SPSS输出的
11、P-值为0.03,则我们应拒绝H0,接受H1。n尽管此推断可能出错,但错误的概率不超过3%。37n例如:某检验,SPSS输出的P-值为0.16,则我们不应拒绝H0n注意:有些统计学家主张,这种情况下,不要说“接受H0”,原因是如果说“接受H0”,会使人们误以为推断H0成立的错误概率很低,但实际上此概率有多大不详,而且通常比人们想象的要大得多!n因为此时面临的是第二类错误。38nP-值为0.16,只是说明,如果我们做出“拒绝H0,接受H1”这种推断,其错误的概率不超过16%,但是并没说我们做出“接受H0,拒绝H1”这种推断错误的概率不超过16%!n有时在这种情况下,我们也说,可以认为H0成立,但
12、切记,此推论是苍白无力的!39n最有说服力的情形是:P-值非常接近0,例如,sig=0.001,我们可以作出接受H1的结论,此结论错误的概率不足0.1%!n由此也可以看出,原假设与对立假设的地位是不对等的。40检验结论的表述方法n如果sig=0.063,下面的说法都是恰当的:n在10%的水平下,检验是显著的。n在5%的水平下,检验是不显著的。n在1%的水平下,检验是不显著的。41几点应牢记的重要结论n必须弄清原假设与对立假设的内容n检验结果为“显著”是指原假设显著不成立。n结论的说服力强弱主要取决于显著水平高低n当作出拒绝零假设(即接受对立假设)结论时,显著水平越低效果越好,因为它表明该结论为
13、错误结论的概率不超过。42n如果我们希望作出接受原假设的结论,则显著水平越低效果越差。因为此结论如果是错误结论,则属于第二类错误,其错误概率为(我们不知道它有多大!),而与的关系是此消彼长的。434.分布正态性检验分布正态性检验n柯尔莫戈洛夫-斯米诺夫检验n夏皮罗-威尔克检验n正态Q-Q图法n直方图n偏度与峰度44柯尔莫戈洛夫柯尔莫戈洛夫-斯米诺夫检验斯米诺夫检验H0总体服从正态分布,H1总体不服从正态分布输出结果中最为重要的是p-值大小。p-值越低(例如小于0.05),表明总体越显著偏离正态分布显著水平越高(例如大于0.2),表明总体越符合正态分布输出结果45n本例中,我们可以做以下结论:n
14、变量NORM在10%的水平下,检验不显著,不能否定该变量服从正态分布。n变量UNI在5%的水平下,检验是显著的,应认为该变量不服从正态分布。46夏皮罗夏皮罗-威尔克检验威尔克检验 该检验与柯尔莫戈洛夫-斯米诺夫检验用法大体相同。当样本容量较大时,系统只给出柯尔莫戈洛夫-斯米诺夫检验结果。输出结果举例47正态正态Q-Q图法图法n(通常称为概率纸检验法)该方法是一种粗略的正态性检验法 如果图中散点大体处于一条直线上 则可判定该组数据服从正态分布 否则可判定不服从正态分布48例例 正态分布的正态正态分布的正态Q-Q图图n该图是服从正态分布变量值的“正态Q-Q图”。n图中散点基本处于一条直线上,表明上
15、述变量服从正态分布。n变量NORM是利用函数normal()由软件自动生成的正态分布随机数。49例例 均匀分布的正态均匀分布的正态Q-Q图图n该图是服从均匀分布变量值的“正态Q-Q图”。n图中散点构成一条曲线,表明上述变量不服从正态分布。n变量UNI是利用函数uniform()由软件自动生成均匀分布随机数。50(三)基本操作方法n单击Analyze菜单n选择Summarize 中的Explore项n对Explore对话框进行设置 选择待分析变量,进入Dependent 框中 如果需要将数据按“性别”或“地区”等进行分类 后进行分析,则需要将分类变量选入 Factor 框中51打开Explore:Plots对话框 Boxplots-箱图输出方式 选中 Normality plots with tests即可得到正态概率图及进行分布正态性检验52n偏度与峰度主要用于作出否定正态分布结论n当其中一个或两个指标的绝对值明显偏离零,例如绝对值大于1时,通常预示着变量偏离正态。53结 束