《抽样误差与假设检验 (2)精选PPT.ppt》由会员分享,可在线阅读,更多相关《抽样误差与假设检验 (2)精选PPT.ppt(81页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于抽样误差与假设检验(2)1第1页,讲稿共81张,创作于星期一总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参 数数 统计推断统计推断统计推断统计推断 statistical inferencestatistical inference如:样本均数如:样本均数 样本标准差样本标准差S 样本率样本率 P如:总体均数如:总体均数 总体标准差总体标准差 总体率总体率内容:内容:1.参数估计参数估计(estimation of parameters)2.包括:点估计与包括:点估计与区间估计区间估计3.2.假设检验假设检验(test of hypothesis)第2页,
2、讲稿共81张,创作于星期一3统计推断统计推断(Statistical inference):用样本信息推论总用样本信息推论总体特征的过程。体特征的过程。包括:包括:参数估计参数估计:运用统计学原理,用从样本计算出来的统计运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。指标量,对总体统计指标量进行估计。假设检验:假设检验:又称显著性检验,是指由样本间存在的差别又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。对样本所代表的总体间是否存在着差别做出判断。第3页,讲稿共81张,创作于星期一4第四章 抽样误差与假设检验第4页,讲稿共81张,创作于
3、星期一5主要内容一、一、抽样误差与标准误抽样误差与标准误二、二、t 分布分布三、三、总体均数的参数估计总体均数的参数估计四、四、假设检验的基本思想和步骤假设检验的基本思想和步骤第5页,讲稿共81张,创作于星期一总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参 数数 统计推断统计推断一、一、抽样误差抽样误差如:如:样本均数样本均数 样本标准差样本标准差S 样本率样本率 P如:如:总体均数总体均数 总体标准差总体标准差 总体率总体率 第6页,讲稿共81张,创作于星期一7抽样误差的定义l由于存在个体变异,这种在抽样过程中产生的样本统计量与总体参数及样本统计量之间的差异
4、,称之为抽样误差。Because of Variation,during the sampling procedure,there are some differences between statistic of sample and parameter of population and also differences among sample statistics.These differences are called sampling error.第7页,讲稿共81张,创作于星期一8以均数的抽样误差为例,它涵盖了两方面的内容:样本均数不同于总体均数样本均数不同于总体均数 样本均数之
5、间也存在着差异样本均数之间也存在着差异 The sampling error of mean covers two sides content:Mean of samples differ with population mean Mean of one sample differs with the one of another sample 第8页,讲稿共81张,创作于星期一9 某农村地区某农村地区1999年年14岁女孩的身高正态分布总体(岁女孩的身高正态分布总体(cm)=143.08,=6.58,N=143.08,=6.58,N1000010000例例lx1x10 142.3 148.8
6、 142.7 144.4 144.7 145.1 143.3 154.2 152.3 142.7lx11x20 156.6 137.9 143.9 141.2 139.3 145.8 142.2 137.9 141.2 150.6lx21x30 142.7 151.3 142.4 141.5 141.9 147.9 125.9 139.9 148.9 154.9lx31x40 145.7 140.8 139.6 148.8 147.8 146.7 132.7 149.7 154.0 158.2lx41x50 138.2 149.8 151.1 140.1 140.5 143.4 152.9 1
7、47.5 147.7 162.6lx51x60 141.6 143.6 144.0 150.6 138.9 150.8 147.9 136.9 146.5 130.6lx61x70 142.5 149.0 145.4 139.5 148.9 144.5 141.8 148.1 145.4 134.6lx71x80 130.5 145.2 146.2 146.4 142.4 137.1 141.4 144.0 129.4 142.8lx81x90 132.1 141.8 143.3 143.8 134.7 147.1 140.9 137.4 142.5 146.6l.lxn-9xn 134.4
8、133.1 145.9 139.2 137.4 142.3 160.9 137.7 142.9 126.8第9页,讲稿共81张,创作于星期一10 以均数为例介绍 从正态分布总体从正态分布总体N(143.08,6.58)中随机抽样,保持中随机抽样,保持样本含量或样本例数不变,均为样本含量或样本例数不变,均为n 10,则每次,则每次抽出的抽出的10个个体组成一个样本,每个样本的均数个个体组成一个样本,每个样本的均数称为样本均数,共抽称为样本均数,共抽M次,则有次,则有M个样本和个样本和M个个样本均数。样本均数。Sampling from normal distribution population
9、 N(143.08,6.58),keep the number of size=10,then ten individuals form a sample.After sampling for M times,we get M samples and M mean of samples().第10页,讲稿共81张,创作于星期一11 由由 组成了一个新的序列。这个新序列中组成了一个新的序列。这个新序列中M个样本个样本均数的情况如何?它们与总体均数的关系如何均数的情况如何?它们与总体均数的关系如何?看下页的抽样结果:?看下页的抽样结果:Then the M make up of a new ser
10、ial.l Qustion1:what is the links of M in new serial?l Question2:what are the relationship between and .Look at the sampling result.第11页,讲稿共81张,创作于星期一12第12页,讲稿共81张,创作于星期一13143.08cm6.58cm第13页,讲稿共81张,创作于星期一14 我们发现我们发现:与原总体均数不一定相等,它们之间存在着差异;与原总体均数不一定相等,它们之间存在着差异;同时同时 之间也不全相等,也存在着差异之间也不全相等,也存在着差异.这两部这两部分
11、差异就称为均数的抽样误差。分差异就称为均数的抽样误差。We found:There are differences between and .At the same time,from different samples varies too.These two parts of difference all together are called sampling error of sample mean.第14页,讲稿共81张,创作于星期一15Question引起抽样误差的原因是什么?引起抽样误差的原因是什么?What is the reason of sampling error?抽样误
12、差可以避免吗?抽样误差可以避免吗?Can it be avoided?第15页,讲稿共81张,创作于星期一16这是一个身高均数=172cm,标准差9.2cm的 正态分布总体第16页,讲稿共81张,创作于星期一17抽样误差不为零sampling error0l由于每个个体的身高差异很大,总体的标准差不为零,则从这个总体当中抽出的样本的构成个体之间也存在着差异。来源于个体的样本均数间和样本均数与总体均数间存在着差异,即抽样误差不等于零的情况。Because of the height of individuals in population vary a lot(0),the height of
13、individuals in sample also differ.Of course there are differences between and,also among .That is the situation with non-zero sampling error.第17页,讲稿共81张,创作于星期一18l可见,标准差不等于零,即存在个体变异,是导致抽样误差的本质原因。l如果去除个体变异,是不是就可以消除抽样误差呢?From that,we wonder if the variation between individuals is the essential reason f
14、or sampling error.So if we get rid of the variation,will sampling error be avoided?第18页,讲稿共81张,创作于星期一19若 均 为160cm理论情况,不可能真实发生Condition in theory第19页,讲稿共81张,创作于星期一20 抽样误差为零sampling error=0l总体的标准差等于零,即每个个体的身高间没有差异,均为160cm,则从这个总体当中抽出的样本均由身高为160cm的个体构成,它们的样本均数也均为160cm。那么在样本均数间和样本均数与总体均数间着不存在着差异,即抽样误差等于零
15、的情况。Because of the height of individuals in population are same(=0),the height of individuals in sample also equal to 160cm.Although sampling for many times,the mean of samples have the same values of 160cm which have no difference with.In this situation,sampling error equals to zero.第20页,讲稿共81张,创作于
16、星期一21l再次证实:标准差等于零,即不存在个体变异是导致抽样误差为零的本质原因。Theoretic condition confirms once more the consumption 第21页,讲稿共81张,创作于星期一22 结论 conclusionl个体变异是导致抽样误差的本质原因。Variation between individuals is the essential reason for sampling errorl由于个体变异是无法消除的,所以只要存在着抽样,就一定存在着抽样误差,即抽样误差是无法避免的。Because the variation can not be
17、avoided,there is always sampling error during the procedure of sampling.第22页,讲稿共81张,创作于星期一23Question如何衡量抽样误差的大小?如何衡量抽样误差的大小?How to weigh the size of sampling error?第23页,讲稿共81张,创作于星期一24 衡量抽样误差大小的指标为标准误。Standard error is the index for evaluating the size of sampling error 衡量均数抽样误差大小的指标为均数的标准误,又称样本均数的标
18、准差。Standard error of Mean can weigh the sampling error of Mean.It is also called the standard deviation of第24页,讲稿共81张,创作于星期一25l从正态分布的总体中随机抽样,则从正态分布的总体中随机抽样,则 组成的新序列也满足正态分布的条件,新序列的组成的新序列也满足正态分布的条件,新序列的均数称为样本均数的均数,标准差称为样本均数均数称为样本均数的均数,标准差称为样本均数的标准差,也称均数的标准误。的标准差,也称均数的标准误。If samples come from a populat
19、ion with normal distribution,the serial makes up of will satisfy the condition of normal distribution.The standard deviation of is called standard deviation of or standard error of mean第25页,讲稿共81张,创作于星期一26l计算公式如下:计算公式如下:第26页,讲稿共81张,创作于星期一27l当抽样次数M为无穷大时,每个个体都有同等的机会被抽入样本,也会对样本均数的均数和标准差有同等的贡献。Under the
20、 circumstance of sampling hundred times,especially infinite times,every individual has the same chance to be taken out and come into the samples.Also every individual has same opportunity to devote itself(value)to calculate the Mean and Standard Deviation of sample mean.第27页,讲稿共81张,创作于星期一28根据中心极限定理A
21、ccording to central limit theoremlWhen M is big enough第28页,讲稿共81张,创作于星期一29回顾个体观察值的标准差的含义Review the meaning of standard deviation for individualsl在由(X1,X2,X3Xn-2,Xn-1,Xn)组成的正态分布总体N(,)中:In the normal population make up of several individuals.第29页,讲稿共81张,创作于星期一30回顾个体观察值的标准差的含义l反映个体观察值离散趋势(变异水平)大小的指标,即每
22、个个体间(xi之间)差异大小的指标 l反映每个个体与它们的均数之间(xi-)差异大小的指标l反映均数对个体观察值的代表性的好坏的指标 第30页,讲稿共81张,创作于星期一31理解样本均数的标准差的含义l在由 组成的正态分布总体中,第31页,讲稿共81张,创作于星期一32理解样本均数的标准差的含义l反映样本均数离散趋势(变异水平)大小的指标,即每个样本均数之间()差异大小的指标l反映每个样本均数与它们的均数即总体均数之间()差异大小的指标l反映均数的抽样误差大小的指标l反映样本均数对总体均数的代表性的好坏的指标第32页,讲稿共81张,创作于星期一33Question抽样误差的大小与哪些因素有关?
23、抽样误差的大小与哪些因素有关?第33页,讲稿共81张,创作于星期一34抽样误差大小的决定因素l从公式中,可以看出:式(4-1)l它与总体的标准差成正比l它与样本含量n的平方根成反比 第34页,讲稿共81张,创作于星期一35抽样误差大小的决定因素极限值 ln=1时,ln=无穷大时,第35页,讲稿共81张,创作于星期一36结论l衡量抽样误差大小的指标:均数的标准误的取值范围为:0l为尽量降低抽样误差,在无法改变总体标准差的情况下,可以通过增大n来达到目的。第36页,讲稿共81张,创作于星期一37 由于在实际抽样计算中,常属未知,而通常仅用一个样本的标准差S作为的估计值,其计算公式为:式(4-2)均
24、数标准误的用途:1.可用来衡量样本均数的可靠性。2.结合样本均数和正态分布曲线下的面积分布规律,可用与估计总体均数的置信区间。3.可用于均数的假设检验。例题4.1见P27第37页,讲稿共81张,创作于星期一抽样试验抽样试验 从正态分布总体从正态分布总体N N(5.00,0.505.00,0.502 2)中,每次随)中,每次随机抽取样本含量机抽取样本含量n n5 5,并计算其均数与标准差;重,并计算其均数与标准差;重复抽取复抽取10001000次,获得次,获得10001000份样本;计算份样本;计算10001000份份样本的均数与标准差,并对样本的均数与标准差,并对10001000份样本的均数份
25、样本的均数作直方图。作直方图。按上述方法再做样本含量按上述方法再做样本含量n n1010、样本含量、样本含量n n3030的抽样实验;比较计算结果。的抽样实验;比较计算结果。第38页,讲稿共81张,创作于星期一抽样试验(抽样试验(n n=5=5)第39页,讲稿共81张,创作于星期一抽样试验(抽样试验(n n=10=10)第40页,讲稿共81张,创作于星期一抽样试验(抽样试验(n n=30=30)第41页,讲稿共81张,创作于星期一10001000份样本抽样计算结果份样本抽样计算结果总体的总体的均数均数总体标总体标准差准差s s均数的均数的均数均数均数标准差均数标准差n n=5=55.005.0
26、00.500.504.994.990.22120.22120.22360.2236n n=10=105.005.000.500.505.005.000.15800.15800.15810.1581n n=30=305.005.000.500.505.005.000.09200.09200.09130.0913第42页,讲稿共81张,创作于星期一3 3个抽样实验结果图示个抽样实验结果图示第43页,讲稿共81张,创作于星期一抽样实验小结抽样实验小结 样本均数样本均数围绕围绕总体均数总体均数上下波动,上下波动,样本均样本均数的均数数的均数与总体均数十分接近。与总体均数十分接近。样本样本均数的标准差均
27、数的标准差即即标准误标准误 与总体与总体标准差标准差 呈正比,与样本含量呈正比,与样本含量n n的平方根呈反的平方根呈反比。即比。即 从正态总体从正态总体N N(m m,s s2 2)中抽取样本,获得均数的中抽取样本,获得均数的分布仍近似呈分布仍近似呈正态分布正态分布N(m m,s s2/n)。第44页,讲稿共81张,创作于星期一中心极限定理中心极限定理 central limit theoremcentral limit theorem即使从即使从非正态总体非正态总体中抽取样本,中抽取样本,n n足够大时,样本均数的分布仍足够大时,样本均数的分布仍近似呈近似呈正态正态。随着样本量的增大随着样
28、本量的增大,样本均数的样本均数的变异变异范围也逐渐变窄。范围也逐渐变窄。第45页,讲稿共81张,创作于星期一461、t 分布的概念:从正态分布演化到t 分布的步骤。反映抽样误差分布的规律。2、t 分布图形:3、t 分布面积特征(t界值表)二、二、t 分布分布第46页,讲稿共81张,创作于星期一标准正态变换与标准正态变换与t t变换变换随机变量随机变量X XN N(m m,s s2 2)标准正态分布标准正态分布N N(0 0,1 12 2)u变换均数均数标准正态分布标准正态分布N N(0 0,1 12 2)Student Student t t分布分布自由度:自由度:n n-1-1第47页,讲稿
29、共81张,创作于星期一t t分布的概率密度函数分布的概率密度函数式中式中 为伽玛函数;为伽玛函数;圆周率(圆周率(ExcelExcel函数为函数为PI()PI())为自由度(为自由度(degree of freedomdegree of freedom),是),是t t分布的唯分布的唯一参数;一参数;t t为随机变量。为随机变量。以以t t为横轴,为横轴,f f(t t)为纵轴为纵轴,可绘制可绘制t t分布曲线。分布曲线。第48页,讲稿共81张,创作于星期一t t分布曲线分布曲线 t t 分布分布有如下性质:有如下性质:一组单峰分布曲线,曲线在一组单峰分布曲线,曲线在t t0 0 处最高,并以
30、处最高,并以t t0 0为中心左右对称为中心左右对称与标准正态分布相比,曲线最高与标准正态分布相比,曲线最高处较矮,两处较矮,两尾部翘得高尾部翘得高(见绿线)(见绿线)决定决定t t分布的参数只有一个,自由分布的参数只有一个,自由度。随自由度增大,曲线逐渐接近正度。随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。态分布;分布的极限为标准正态分布。第49页,讲稿共81张,创作于星期一50t 值表值表(附表(附表2 )横坐标:自由度,横坐标:自由度,纵坐标:概率,纵坐标:概率,p,即曲线下阴影部分的面积即曲线下阴影部分的面积;表中的数字:相应的表中的数字:相应的|t|界值。界值。第5
31、0页,讲稿共81张,创作于星期一t t分布曲线下面积(附表分布曲线下面积(附表2 2)双侧双侧t t0.05/20.05/2,9 92.2622.262 单侧单侧t t0.0250.025,9 9单侧单侧t t0.050.05,9 91.8331.833双侧双侧t t0.01/20.01/2,9 93.2503.250 单侧单侧t t0.0050.005,9 9单侧单侧t t0.010.01,9 92.8212.821双侧双侧t t0.05/20.05/2,1.961.96 单侧单侧t t0.0250.025,单侧单侧t t0.050.05,1.641.64第51页,讲稿共81张,创作于星期一
32、52t 值表规律:值表规律:(1)自由度(自由度()一定时,)一定时,p 与与|t|成反比成反比;(2)概率(概率(p)一定时,一定时,与与|t|成反比成反比;t分布的用途:分布的用途:总体均数的区间估计 t检验第52页,讲稿共81张,创作于星期一三、三、总体均数的参数估计总体均数的参数估计 包括:总体均数的点估计(包括:总体均数的点估计(point estimationpoint estimation)与区间估计)与区间估计参数估计参数估计点估计点估计:由样本统计量:由样本统计量 直接估计直接估计 总体参数总体参数区间估计区间估计:在一定:在一定可信度可信度(Confidence level
33、)下,下,估计总体参数可能存在的范围,估计总体参数可能存在的范围,同时考虑抽样误差同时考虑抽样误差第53页,讲稿共81张,创作于星期一54可信区间可信区间(confidence interval,CI)的概念的概念 概念概念:根据样本均数,按一定的根据样本均数,按一定的可信度可信度计算计算 出总体均数很可能在的一个出总体均数很可能在的一个数值数值范围范围,这个范围称为总体均数的可信区,这个范围称为总体均数的可信区间,也叫间,也叫置信区间,置信区间,。计算方法见下页:计算方法见下页:第54页,讲稿共81张,创作于星期一55l 设有一正态总体设有一正态总体N(,2),和和2 未知,现从中随机抽出一
34、份样本,该样本未知,现从中随机抽出一份样本,该样本的均数和标准差为的均数和标准差为 据此估计总据此估计总体均数体均数的大概范围。的大概范围。l前已指出,正态总体前已指出,正态总体N(,2)的样本均的样本均数数 的的t 变换结果变换结果 总体均数置信区间计算的总体均数置信区间计算的t分布方法分布方法第55页,讲稿共81张,创作于星期一56l故有故有95%的样本均数满足不等式的样本均数满足不等式第56页,讲稿共81张,创作于星期一57(1)已知时,按正态分布原理,用公式 估计总体均数的95%的置信区间。(2)未知、且样本例数较小时,按t分布原理,估计总体均数的95%置信区间。例4.2见P31。(3
35、)未知,但样本例数n足够大时,按正态分布原理,估计总体均数95%置信区间。例4.3见P31。第57页,讲稿共81张,创作于星期一58总体均数的95置信区间的涵义l例4.2和4.3见P29l理论上,做100次抽样,可算得100个置信区间,平均有95个置信区间包括总体均数,只有5个置信区间不包含总体均数。这种估计方法会冒5犯错误的风险。第58页,讲稿共81张,创作于星期一59 换句话说,做出该地该地换句话说,做出该地该地12岁男孩身高的总体均数岁男孩身高的总体均数在在138.3141.0cm之间的结论,说对的概率是之间的结论,说对的概率是95%,说,说错的概率是错的概率是5%。意义:意义:虽然不能
36、知道该地虽然不能知道该地12岁男孩身高的总体均数的确切岁男孩身高的总体均数的确切数值,但有数值,但有95%的把握说该地的把握说该地12岁男孩身高的总体均数岁男孩身高的总体均数在在138.3141.0cm之间。之间。第59页,讲稿共81张,创作于星期一60参数估计的准确度:参数估计的准确度:说对的可能性大小,说对的可能性大小,用用(1-)来衡来衡量。量。99%的可信区间好于的可信区间好于95%的可信区间的可信区间(n,S 一定时)一定时)。参数估计的精确度:参数估计的精确度:指区间范围的宽窄,范围越宽精确度指区间范围的宽窄,范围越宽精确度越差。越差。99%的可信区间的可信区间差于差于95%的可信
37、区间的可信区间(n,S 一定时)一定时)。准确度与精确度的关系:准确度与精确度的关系:有区别也有联系。第60页,讲稿共81张,创作于星期一可信度实验可信度实验 第61页,讲稿共81张,创作于星期一 第62页,讲稿共81张,创作于星期一63第三节第三节 假设检验假设检验显著性检验显著性检验;科研数据处理的重要工具科研数据处理的重要工具;某事发生了:某事发生了:是由于碰巧?还是由于必是由于碰巧?还是由于必然的原因?统计学家运用然的原因?统计学家运用显著性检验来处理这类问显著性检验来处理这类问题。题。第63页,讲稿共81张,创作于星期一64假设检验假设检验l1、原因l2、目的l3、原理l4、过程(步
38、骤)l5、结果第64页,讲稿共81张,创作于星期一651、假设检验的原因、假设检验的原因 由于个体差异的存在,即使从同一由于个体差异的存在,即使从同一总体中严格的随机抽样,样本均数之间也总体中严格的随机抽样,样本均数之间也存在着差异。存在着差异。因此,因此,不同有两种(而且只有两种)不同有两种(而且只有两种)可能:可能:第65页,讲稿共81张,创作于星期一66来自于同一个总体,差异由抽样误差导致抽样误差,个体变异2第66页,讲稿共81张,创作于星期一67来自于两个不同的总体,样本均数之间的差异由本质差异导致本质差异,超出抽样误差可解释的范围2第67页,讲稿共81张,创作于星期一681、假设检验
39、的原因、假设检验的原因 (1)来自总体均数相同的总体,由于抽样误)来自总体均数相同的总体,由于抽样误差造成了样本均数的差别。它们之间的差差造成了样本均数的差别。它们之间的差异有抽样误差导致。异有抽样误差导致。(2)来自总体均数不同的两个总体。它们之)来自总体均数不同的两个总体。它们之间的差别是由本质差异导致的。间的差别是由本质差异导致的。第68页,讲稿共81张,创作于星期一692、假设检验的目的、假设检验的目的l判断是由于何种原因造成的不同,以做出决策。第69页,讲稿共81张,创作于星期一70反证法:当一件事情的发生只有两种可能反证法:当一件事情的发生只有两种可能A和和B,为了肯定,为了肯定其
40、中的一种情况其中的一种情况A,但又不能直接证实,但又不能直接证实A,这时可通过否,这时可通过否定另一种可能定另一种可能B,则间接地肯定了,则间接地肯定了A。概率论(小概率事件):如果一件随机事情发生的概率很概率论(小概率事件):如果一件随机事情发生的概率很小,那么在进行一次抽样试验时,我们说这个事件是小,那么在进行一次抽样试验时,我们说这个事件是“不不会发生的会发生的”。从一般的常识可知,这句话在大多数情况下。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的是有可能发生的。3、假设检验的原理
41、、假设检验的原理/思想思想第70页,讲稿共81张,创作于星期一714、假设检验的一般步骤、假设检验的一般步骤 建立假设(反证法)建立假设(反证法)确定检验水准,显著性水平(确定检验水准,显著性水平()计算统计量:计算统计量:u,t,F 确定概率值确定概率值P 做出推断结论做出推断结论第71页,讲稿共81张,创作于星期一72(1 1).建立假设建立假设检验假设或无效假设,零假设检验假设或无效假设,零假设(null hypothesis),用H H0 0表示,H H0 0总是假设两总体均数相等。备择假设备择假设(alternative hypothesis),用H H1 1表示。H1是在H0不成立
42、的情况下,可以供我们选择的另一种假设。常假设两总体均数不相等。第72页,讲稿共81张,创作于星期一73(1 1).建立假设时的注意事项:建立假设时的注意事项:检验假设和备择假设是一对既有区别又相互关联的假设群,缺一不可。两者互补,他们的合集即为全集。假设一定是针对未知的总体而言。而不是已知的样本均数之间的比较。第73页,讲稿共81张,创作于星期一74(2)确定确定检验水准或检验水准或显显著性水平(著性水平(significance significance level level)显著性水平()就是我们用来区分大概率事件和小概率事件的标准,是人为规定的。当某事件发生的概率小于时,则认为该事件为
43、小概率事件,是在一次抽样中不太可能发生的事件。通常 取0.05 或 0.01,0.10等。注明单侧或双侧。第74页,讲稿共81张,创作于星期一75(3)计算统计量计算统计量 根据资料的性质,设计类型及样本例数的多少,选择适当的公式。计算出统计量,u 值、t 值或F值。注意:统计量是在检验假设或零假设成立的前提条件下来计算的。第75页,讲稿共81张,创作于星期一76(4)确定概率值(确定概率值(P)将计算得到的u值或 t值结合自由度与查表得到u或t,,比较,得到 P值的大小。根据u分布和t分布我们知道,如果|u|u或|t|u,则 P;如果|u|u或|t|。P值的含义:从H0 0所规定的总体进行随
44、机抽样,获得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率第76页,讲稿共81张,创作于星期一77(5)作出推断结论作出推断结论如果P,认为在检验假设H0成立的条件下,抽到当前或更极端样本的概率大于,不属于小概率事件,则不拒绝H0,差别无统计学意义,结论是还不能认为两总体均数之间存在着差异。第78页,讲稿共81张,创作于星期一79 5、假设检验的结果、假设检验的结果 l拒绝零假设,接受备择假设。l不拒绝零假设。不拒绝零假设。正确理解结论的概率性(都隐含着犯错误的可能性)。正确理解结论的概率性(都隐含着犯错误的可能性)。第79页,讲稿共81张,创作于星期一80总结要点l抽样误差的概念和评价抽样误差的指标的定义,含义及计算方法lt变换及t分布的特点及应用l参数估计,尤其是区间估计的概念及计算公式l可信区间与参考值范围的区别l假设检验的原理和步骤第80页,讲稿共81张,创作于星期一16.09.2022感感谢谢大大家家观观看看第81页,讲稿共81张,创作于星期一