《第八章-假设检验课件.ppt》由会员分享,可在线阅读,更多相关《第八章-假设检验课件.ppt(75页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章第八章 假设检验假设检验李金德李金德n第一节第一节 假设检验的原理假设检验的原理n第二节第二节 平均数的显著性检验平均数的显著性检验n第三节第三节 平均数差异的显著性检验平均数差异的显著性检验n第四节第四节 方差的差异检验方差的差异检验n第五节第五节 相关系数的显著性检验相关系数的显著性检验n第六节比率的显著性检验第六节比率的显著性检验第一节第一节 假设检验的原理假设检验的原理n在统计学中,通过样本统计量得出的差异做出一般性在统计学中,通过样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异,这种推论过结论,判断总体参数之间是否存在差异,这种推论过程称作程称作假设检验假设检验
2、(hypothesis testing)n假设检验分为假设检验分为参数检验参数检验和和非参数检验非参数检验。前者指的是总。前者指的是总体分布已知,需要对总体的未知参数做假设检验。后体分布已知,需要对总体的未知参数做假设检验。后者指的是总体分布知之甚少,对总体的函数形式和特者指的是总体分布知之甚少,对总体的函数形式和特征进行假设检验。征进行假设检验。n假设检验是推论统计中假设检验是推论统计中最重要最重要的内容。的内容。B总体总体A样本样本样本有差异样本有差异A总体总体B样本样本总体有差异总体有差异推论推论第一节第一节 假设检验的原理假设检验的原理n先看一个例子:先看一个例子:n例:张老师有一个已
3、经测试过千名大学生的人格测验,例:张老师有一个已经测试过千名大学生的人格测验,得到平均分为得到平均分为50,标准差为,标准差为12,且该测验分数呈正态,且该测验分数呈正态分布。他认为心理学专业学生的性格与其他大学生不分布。他认为心理学专业学生的性格与其他大学生不同,因此他用这人格测验测试了同,因此他用这人格测验测试了16名心理学专业的大名心理学专业的大学生,结果他们的平均分为学生,结果他们的平均分为58。n张老师声称这就是心理学专业与其他专业性格不同的张老师声称这就是心理学专业与其他专业性格不同的证据。他的说法合理吗?证据。他的说法合理吗?分析这个例子分析这个例子n这种判断是基于这种判断是基于
4、样本平均数样本平均数对心理学专业学生对心理学专业学生总体的总体的平均数与目标总体平均数差异平均数与目标总体平均数差异的推断。的推断。n因为这个因为这个16名学生的平均分高于性格测验的平均分名学生的平均分高于性格测验的平均分(5850),故张老师认为心理学专业的总体比一般),故张老师认为心理学专业的总体比一般大学生性格分数更高。大学生性格分数更高。n他的推断的假设:他的推断的假设:心理学专业学生总体的平均分和这心理学专业学生总体的平均分和这个样本的平均分是一样的个样本的平均分是一样的,高于一般大学生在性格测,高于一般大学生在性格测试上的平均分。试上的平均分。总体均值的可能情形总体均值的可能情形n
5、总体均值有三种可能:总体均值有三种可能:n1.心理学专业总体均分与其他专业心理学专业总体均分与其他专业相同相同,都是,都是50分分n2.心理学专业总体均分心理学专业总体均分高于高于50,正如张老师所暗示正如张老师所暗示n3.心理学专业总体均分心理学专业总体均分低于低于50n所以,仅仅基于样本平均数,就推断总体与一般学生所以,仅仅基于样本平均数,就推断总体与一般学生的有不同,是的有不同,是考虑不全面的考虑不全面的。必须经过必要检验。必须经过必要检验。如何进行检验?如何进行检验?n1.张老师认为:张老师认为:n心理学与一般大学生的性格测试平均数心理学与一般大学生的性格测试平均数不同不同-假设假设1
6、n2.与假设与假设1相对的假设是:相对的假设是:n心理学与一般大学生的性格测验平均数心理学与一般大学生的性格测验平均数相同相同-假设假设0n3.假设假设1(H1)与假设)与假设0(H0)是)是互斥互斥的。的。n若若H1,则,则H0 n若若H1,则,则H0 一、备择假设与虚无假设一、备择假设与虚无假设n(一)备择假设(一)备择假设n1.就是实验人员希望证实的假设,也称研究假设。就是实验人员希望证实的假设,也称研究假设。n2.性质:性质:假设两个样本统计(或两个总体参数)之间,假设两个样本统计(或两个总体参数)之间,又或者是样本统计量与总体参数之间存在真实的差异,又或者是样本统计量与总体参数之间存
7、在真实的差异,是一种是一种有差假设,有差假设,用用H1表示表示。n3.表达方式,如表达方式,如:nH1:或或 ;或或 。(二)虚无假设(二)虚无假设n1.研究人员为了证实研究假设是真的而利用概率论的研究人员为了证实研究假设是真的而利用概率论的反证法反证法所进行的假设,即从研究假设的反面进行假设。所进行的假设,即从研究假设的反面进行假设。n2.性质性质:虚无假设是假设两个总体参数之间或样本统:虚无假设是假设两个总体参数之间或样本统计量与总体参数之间不存在真正的差异,其现存的表计量与总体参数之间不存在真正的差异,其现存的表面差异是由抽样所造成的误差,是一种面差异是由抽样所造成的误差,是一种无差假设
8、无差假设,又,又称称零假设零假设或或原假设原假设,用,用H0符号表示。符号表示。n表达方式表达方式:nH0:或或 ;或或(三)备择假设和虚无假设的关系(三)备择假设和虚无假设的关系nH0零假设:零假设:心理学专业心理学专业=50nH1备择假设:备择假设:心理学专业心理学专业50nH1是想要的结果,但是无法直接验证是想要的结果,但是无法直接验证n只能通过证明只能通过证明H0,反证,反证H1的正确与否的正确与否n结论:找到证明结论:找到证明H0正确与否的依据就是假设检验的关正确与否的依据就是假设检验的关键!键!(四)零假设检验依据(四)零假设检验依据抽样分布抽样分布n根据均值的样本分布原理可计算:
9、在一个平均数为根据均值的样本分布原理可计算:在一个平均数为50的总体中,抽取一个的总体中,抽取一个16名学生的样本,其样本平均数名学生的样本,其样本平均数为为58的概率,有的概率,有1%的概率可能等于或大于的概率可能等于或大于58。n1%的概率意味着什么?的概率意味着什么?小概率事件!小概率事件!14 26 38 50 62 74 8641 44 47 50 53 56 6158(五(五)小概率事件)小概率事件n统计学上小概率事件是指是指在统计学上小概率事件是指是指在一次试验中一次试验中几乎不可几乎不可能发生的,如果发生了则该事件被认为是不合理的。能发生的,如果发生了则该事件被认为是不合理的。
10、n传统上,将不超过传统上,将不超过0.05的事件当做的事件当做“小概率事件小概率事件”,有时也定有时也定0.01和和0.001,。n回到问题:回到问题:在一次从总体(在一次从总体(=50,=12)的抽样中)的抽样中(n=16),有,有1%的可能性,样本的均值为的可能性,样本的均值为58,意味着,意味着小概率事件发生了,即小概率事件发生了,即58这个数不是从这个总体中抽这个数不是从这个总体中抽出来的。出来的。(张老师的判断是对的!)(张老师的判断是对的!)二、二、显著性水平显著性水平n1.含义:指为拒绝虚无假设(零假设)而设定的小概含义:指为拒绝虚无假设(零假设)而设定的小概率值。率值。n2.零
11、假设与显著性水平的关系:零假设与显著性水平的关系:n如果零假设正确的可能性只有如果零假设正确的可能性只有5%,我们就排除零假,我们就排除零假设。还可以把这临界值设置在设。还可以把这临界值设置在1%或者或者0.1%。这种。这种临临界概率界概率就称为就称为显著性水平显著性水平。n显然通过显著性水平可以判断是否接受零假设。显然通过显著性水平可以判断是否接受零假设。n3.显著性水平与拒绝和接受域显著性水平与拒绝和接受域n因为因为5%的显著性水平在正态分布上对应的的显著性水平在正态分布上对应的Z值为值为1.96,所以当检验值落在,所以当检验值落在-1.96-1.96,1.96,1.96 时,时,我们认为
12、零假设有我们认为零假设有95%95%是对的,接受它,则该区域为是对的,接受它,则该区域为接受域。接受域。n而当检验值落在(而当检验值落在(-,-1.96-1.96)或()或(1.961.96,+)时,)时,我们认为零假设只有我们认为零假设只有5%5%是对的,拒绝它,则该区域为是对的,拒绝它,则该区域为拒绝域。拒绝域。1.96 1.96 接受接受H0 拒绝拒绝H0 拒绝拒绝H0 95%0.0250.025 0.0250.025n4.差异显著判断规则差异显著判断规则(正态检验)(正态检验)n虽然我们比较习惯取虽然我们比较习惯取=0.05和和=0.01,但也可以取其,但也可以取其它的显著性水平值,如
13、它的显著性水平值,如0.005或或0.001。Zp值值显显著性著性符号表示符号表示1.960.05不不显显著著1.960.05显显著著*2.580.01极极显显著著*三、假设检验中的两类错误三、假设检验中的两类错误(一)定义(一)定义n 错误错误(I型错误型错误):H0为真时却被拒绝为真时却被拒绝,弃真错误弃真错误;错误错误是指虚无假设本身是正确的,但由于抽样的随机性而是指虚无假设本身是正确的,但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域,致使我们作出使检验值落入了拒绝虚无假设的区域,致使我们作出了拒绝虚无假设的结论,了拒绝虚无假设的结论,n 错误错误(II型错误型错误):H0为假时却
14、被接受为假时却被接受,取伪错误取伪错误;错;错误是指虚无假设本身不正确,但由于抽样的随机性而误是指虚无假设本身不正确,但由于抽样的随机性而使检验值落入了接受虚无假设的区域,致使我们作出使检验值落入了接受虚无假设的区域,致使我们作出了接受虚无假设的结论,说明事物之间没有显著的差了接受虚无假设的结论,说明事物之间没有显著的差异。异。表解两类错误表解两类错误接受接受H0拒绝拒绝H0H0为真为真正确正确型错误型错误错误错误H0为假为假型错误型错误错误错误正确正确表表8-2 假设检验的各种可能结果假设检验的各种可能结果(二)两类错误的关系(二)两类错误的关系n1.1n原因:原因:与与 是两个前提下的概率
15、。是两个前提下的概率。n即即 是拒绝原假设是拒绝原假设H0时犯错误的概率,这时前提是时犯错误的概率,这时前提是H0为真;为真;n 是接受原假设是接受原假设H0时犯错误的概率,这时前提是时犯错误的概率,这时前提是H0为伪。为伪。1H0为真,为真,即即 0=0=1 1的分布的分布01H1为真,为真,即即 0 01 1的分布的分布n2.在其他条件不变情况下,在其他条件不变情况下,和和不能同时减小或增不能同时减小或增大。大。n当当减小的减小的时时候,候,一定增大。一定增大。n当当增大的增大的时时候,候,一定减少。一定减少。n想要想要和和同同时时降低,需要改降低,需要改变变数据分布,即要增大数据分布,即
16、要增大抽抽样样的的样样本。本。0101n3.统计检验力:统计检验力:1-011-1-(四)单侧与双侧检验(四)单侧与双侧检验n1.双侧检验:只强调差异,不管大小。双侧检验:只强调差异,不管大小。n检验假设为:检验假设为:nH0零假设零假设:1=0 0nH1备择假设:备择假设:10 0 0.0250.025 0.0250.0250n2.单侧检验:强调大小。单侧检验:强调大小。n检验假设形式一:检验假设形式一:nH0零假设零假设:10 0nH1备择假设:备择假设:1 0 0 0.050.050n2.单侧检验:强调大小。单侧检验:强调大小。n检验假设形式二:检验假设形式二:nH0零假设零假设:10
17、0nH1备择假设:备择假设:1 1.96,所以所以Z落入拒绝区域落入拒绝区域,应推翻应推翻H0,接受接受H1。即该班的智力水平与常模有显著差异即该班的智力水平与常模有显著差异。第二节第二节 平均数的显著性检验平均数的显著性检验n一、检验方法一、检验方法n平均数的显著性检验是指检验一个样本均数与相应总平均数的显著性检验是指检验一个样本均数与相应总体均数之差(即体均数之差(即 )是否显著的统计方法是否显著的统计方法二、条件分析二、条件分析1确定是双尾检验,还是单尾检验。确定是双尾检验,还是单尾检验。2明确总体方差明确总体方差2是已知的,还是未知的。是已知的,还是未知的。3分析总体分布是正态的,还是
18、非正态的。分析总体分布是正态的,还是非正态的。4决定是采用决定是采用Z检验,还是检验,还是t检验,又或是检验,又或是Z检验。检验。三、综合训练三、综合训练n例例8-2:全区统一考试物理平均分为:全区统一考试物理平均分为50分,标准差为分,标准差为10分。某校的一个班。人数为分。某校的一个班。人数为41人,平均成绩为人,平均成绩为52.5分,问该班成绩与全区平均成绩差异是否显著?(假分,问该班成绩与全区平均成绩差异是否显著?(假设全区考生成绩为正态分布)设全区考生成绩为正态分布)n条件分析条件分析 由题目条件可知,总体分布为正态,总体方差已由题目条件可知,总体分布为正态,总体方差已知,样本容量大
19、于知,样本容量大于30,且为双侧检验,故应选择,且为双侧检验,故应选择Z检检验。验。解:解:(1)建立假设)建立假设 Ho:,即该班成绩与全区成绩没有差异,即该班成绩与全区成绩没有差异 H1:,即该班成绩与全区成绩有差异,即该班成绩与全区成绩有差异(2)计算标准误和检验值)计算标准误和检验值标准误:标准误:检验值:检验值:n(3)比较与决策比较与决策n因为因为Z0.05/2=1.96 Z=1.6,接受,接受Ho,拒绝,拒绝H1 1.96 1.96 接受接受H0 拒绝拒绝H0 拒绝拒绝H0 0.0250.025 0.0250.025 1.61.6例例8-3:n有人研究早期教育对儿童智力发展的影响
20、有人研究早期教育对儿童智力发展的影响,从受过良从受过良好教育的儿童中随机抽取好教育的儿童中随机抽取70人进行韦氏儿童智力测验人进行韦氏儿童智力测验(0=100,0=15)结果结果X=103.3,能否认为受过良好能否认为受过良好早期教育的儿童智力高于一般水平。早期教育的儿童智力高于一般水平。n条件分析条件分析n总体正态,方差已知,样本总体正态,方差已知,样本30,单侧检验,单侧检验Z检验。检验。解:解:(1)建立假设)建立假设 Ho:,早期教育儿童智力低于一般儿童,早期教育儿童智力低于一般儿童 H1:,早期教育儿童智力高于一般儿童,早期教育儿童智力高于一般儿童(2)计算标准误和检验值)计算标准误
21、和检验值标准误:标准误:检验值:检验值:n(3)比较与决策比较与决策n因为因为Z=1.84 Z0.05=1.645,拒绝,拒绝Ho,接受,接受H1。1.84 接受接受H0 拒绝拒绝H0 p=0.050.05 1.6451.645例例8-4:n某心理学家认为一般汽车司机的视反应时平均某心理学家认为一般汽车司机的视反应时平均175毫毫秒,有人随机抽取秒,有人随机抽取36名汽车司机作为研究样本进行了名汽车司机作为研究样本进行了测定,结果平均值为测定,结果平均值为180毫秒,标准差毫秒,标准差25毫秒。能否毫秒。能否根据测试结果否定该心理学家的结论。(假定人的视根据测试结果否定该心理学家的结论。(假定
22、人的视反应时符合正态分布)反应时符合正态分布)n条件分析条件分析 已知总体正态分布,总体方差未知,故选择已知总体正态分布,总体方差未知,故选择t检验。检验。n(1)建立假设建立假设:n(2)计算标准误和统计量)计算标准误和统计量n(3)查)查t分布表分布表(双侧)(双侧)n当当df=35,t0.052=2.031.18,接受,接受H0。2.03 2.03 接受接受H0 拒绝拒绝H0 拒绝拒绝H0 0.0250.025 0.0250.025 1.181.18课堂练习课堂练习n练习练习1:n根据某标准化阅读理解测验的规则,根据某标准化阅读理解测验的规则,8年级的学生的年级的学生的平均应达到平均应达
23、到73.2分,标准差为分,标准差为8.6分。如果从某校区分。如果从某校区随即抽取随即抽取45个样本,其均数为个样本,其均数为76.7。试问该校区的阅。试问该校区的阅读理解测验的平均成绩是否显著高于全体读理解测验的平均成绩是否显著高于全体8年级学生年级学生的成绩?的成绩?n练习练习2:n在一项空间知觉能力测试后,随机抽取在一项空间知觉能力测试后,随机抽取6名被试的成名被试的成绩为绩为1.4、1.8、1.1、1.9、2.2、1.21,这些数值是否,这些数值是否能证明能证明“这种能力测试平均数一般为这种能力测试平均数一般为1.5”的论断?的论断?第三节第三节 平均数差异的显著性检验平均数差异的显著性
24、检验n一、均数之差标准误的基本公式一、均数之差标准误的基本公式 随机从总体中抽取两个容量为随机从总体中抽取两个容量为n1和和n2的一切可能样本的一切可能样本时,两个样本的均数之差时,两个样本的均数之差 也会形成一种抽也会形成一种抽样分布,两均数之差样分布,两均数之差D在抽样分布上的标准差称两均在抽样分布上的标准差称两均数之差的标准误,记为数之差的标准误,记为 。只是根据不同的具体。只是根据不同的具体条件,条件,公式有所不同。公式有所不同。(一)总体正态,(一)总体正态,2已知时的标准误已知时的标准误n1.相关样本相关样本n因为是相关样本因为是相关样本n1=n2=n,则公式可以写为,则公式可以写
25、为n2.独立样本独立样本n如果如果n1=n2,则公式可以写为,则公式可以写为(二)总体正态、(二)总体正态、2未知未知n1.样本独立,但样本独立,但1=2=0n因为因为0未知,只能用样本值估计值标准误未知,只能用样本值估计值标准误n 为联合方差为联合方差n因为因为n所以所以(二)总体正态、(二)总体正态、2未知未知n2.样本独立,方差不齐性(不相等)样本独立,方差不齐性(不相等)n因为因为0未知,只能用样本值估计值标准误未知,只能用样本值估计值标准误(二)总体正态、(二)总体正态、2未知未知n3.样本相关,相关系数已知样本相关,相关系数已知n因为样本相关,所以你因为样本相关,所以你n1=n2=
26、n(二)总体正态、(二)总体正态、2未知未知n4.样本相关,相关系数未知样本相关,相关系数未知二、综合练习二、综合练习n例例8-6:从某地区的六岁儿童中随机抽取男生:从某地区的六岁儿童中随机抽取男生30人,人,身高平均为身高平均为1114cm,抽取女生,抽取女生27人平均身高人平均身高112.5cm。根据以往资料,该地区六岁男童身高的标。根据以往资料,该地区六岁男童身高的标准差准差 5cm。女童身高标准差。女童身高标准差6.5cm,能否根据这一次,能否根据这一次抽样测量的结果下结论:该地区六岁男女童身高有显抽样测量的结果下结论:该地区六岁男女童身高有显著差异。著差异。n分析:根据题意,两总体正
27、态分布,总体方差已知,分析:根据题意,两总体正态分布,总体方差已知,故用故用Z检验。检验。解:解:n(1)建立假设)建立假设n(2)计算标准误和统计量)计算标准误和统计量n因为假设因为假设n比较与决策比较与决策n0.961.96,接受,接受H0,拒绝拒绝H1。n答:该地区六岁儿童男女身高差异不显著。答:该地区六岁儿童男女身高差异不显著。例例8-7:n幼儿园在儿童入园时对幼儿园在儿童入园时对49名儿童进行了比奈智力测验名儿童进行了比奈智力测验(=16),结果平均智商结果平均智商M=106,一年后再对同组被试施一年后再对同组被试施测测,结果结果X2=110,已知两次测验结果的相关系数已知两次测验结
28、果的相关系数r=0.74,问能否说随着年龄增长与一年的教育问能否说随着年龄增长与一年的教育,儿童智儿童智商有了显著提高。商有了显著提高。n分析:正态,方差已知,样本相关,单侧分析:正态,方差已知,样本相关,单侧Z检验。检验。解:解:n(1)建立假设)建立假设n(2)计算标准误和检验值)计算标准误和检验值n(3)比较与决策比较与决策 0.01水平值单侧临界值为水平值单侧临界值为Z=2.322.34,拒绝拒绝H0,接受,接受H1,即一年后儿童智力有了非常显著的提高。即一年后儿童智力有了非常显著的提高。例例8-8n在一项关于反馈对知觉判断的影响的研究中,将被试在一项关于反馈对知觉判断的影响的研究中,
29、将被试随机分成两组,其中一组随机分成两组,其中一组60人作为实验组(每一次判人作为实验组(每一次判断后将结果告诉被试),实验的平均结果断后将结果告诉被试),实验的平均结果M=80,标,标准差准差S S=18;另一组;另一组52人作为控制组(实验过程中每一人作为控制组(实验过程中每一次判断后不让被试知道结果),实验的平均结果次判断后不让被试知道结果),实验的平均结果 M=73,S S=15。试问实验组与控制组的平均结果是否有。试问实验组与控制组的平均结果是否有显著差异?显著差异?n分析:总体正态,方差未知分析:总体正态,方差未知(假设齐性假设齐性),样本独立,样本独立t解解(1)建立假设)建立假
30、设(2)计算统计量)计算统计量n(3)决策)决策n根据题意,应进行双侧检验,查根据题意,应进行双侧检验,查t表,当表,当df=60+52-2=110,=1.982.19,拒绝,拒绝H0,接受,接受H1。即实。即实验组和控制组的平均数有差异。验组和控制组的平均数有差异。例例8-10:n对对9个个被被试试进进行行两两种种角角度度(15,30)的的缪缪勒勒莱莱依依尔尔错错觉觉实实验验结结果果下下,问问两两种种夹夹角角的的情情况况下下错错觉觉量量是是否否有有显著差异?显著差异?被被试试12345678915 14.7 18.9 17.2 15.4 15.3 13.9 20.0 16.2 15.3 14
31、.7 18.9 17.2 15.4 15.3 13.9 20.0 16.2 15.33030 10.6 15.1 16.2 11.2 12.0 14.7 18.1 13.8 10.9 10.6 15.1 16.2 11.2 12.0 14.7 18.1 13.8 10.9d4.13.81.04.23.3-0.81.92.44.4n解:(解:(1)建立假设)建立假设 n(2)计算统计量)计算统计量 =16.3,=13.62,=2.73n(3)比较与决策)比较与决策 查查t值表,值表,df=n-1=8时:时:;拒绝拒绝HO,接受,接受H1,即两种夹角情况下错觉量是有差异的。即两种夹角情况下错觉量是
32、有差异的。第四节第四节 方差的差异检验方差的差异检验n一、样本方差与总体方差的差异显著性检验一、样本方差与总体方差的差异显著性检验例例8-12n全区统考中全区统考中,全体学生的总方差为全体学生的总方差为182分分,而某校而某校40名名学生成绩的方差为学生成绩的方差为122分分,问该校学生成绩的方差与全问该校学生成绩的方差与全区方差有无显著差异区方差有无显著差异?n分析:方差的差异比较,用卡方检验。分析:方差的差异比较,用卡方检验。解解查查 表,当表,当df=40-1=39时,时,即,即17.782.14,即,即 ,p0.05 答:男女生闪光融合频率的方差在答:男女生闪光融合频率的方差在0.05水平差异显著。水平差异显著。课堂练习课堂练习n例例8-14:对:对【例例8-8】和和【例例8-9】进行方差齐性检验。进行方差齐性检验。图解两种错误图解两种错误 接受接受H0 拒绝拒绝H0 拒绝拒绝H0 1-/2/2拒绝拒绝H0,但仍有,但仍有可能性是可能性是错错的的接受接受H0,但仍有,但仍有可能性是可能性是错的的