《单样本检验PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《单样本检验PPT讲稿.ppt(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、单样本检验第1页,共20页,编辑于2022年,星期五10.4.1 统计学上的定义和计算公式统计学上的定义和计算公式10.4 SPSS10.4 SPSS单样本单样本K-SK-S检验检验定义:定义:K-SK-S(Kolmogorov-SmirnovKolmogorov-Smirnov)检验)检验它是检验单一样本是否来自某一特定分布的方法。它是检验单一样本是否来自某一特定分布的方法。它的检验方法它的检验方法是以样本数据的累计频数分布与特是以样本数据的累计频数分布与特定理论分布比较,若两者间的差距很小,则推论定理论分布比较,若两者间的差距很小,则推论该样本取自某特定分布族。该样本取自某特定分布族。第2
2、页,共20页,编辑于2022年,星期五假设检验问题:假设检验问题:H0:样本所来自的总体分布服从某特定分布样本所来自的总体分布服从某特定分布H1:样本所来自的总体分布不服从某特定分布样本所来自的总体分布不服从某特定分布第3页,共20页,编辑于2022年,星期五F0(x)表示理论分布的分布函数,表示理论分布的分布函数,Fn(x)表示表示一组随机样本的累计频率函数。一组随机样本的累计频率函数。设设D为为F0(x)与与Fn(x)差距的最大值,定义如下差距的最大值,定义如下式:式:D=max|Fn(x)-F0(x)|结论:结论:当实际观测当实际观测DD(n,)(D(n,)是显著是显著水平为水平为样本容
3、量为样本容量为n时,时,D的拒绝临界值),的拒绝临界值),则拒绝则拒绝H0,反之则接受反之则接受H0假设。假设。第4页,共20页,编辑于2022年,星期五D(n,)的简略表的简略表第5页,共20页,编辑于2022年,星期五以以Kolmogorov-Smirnov正态性检验为例介正态性检验为例介绍它的统计原理。绍它的统计原理。例例1:35位健康男性在未进食前的血糖浓度如位健康男性在未进食前的血糖浓度如表所示,试测验这组数据是否来自正态分布表所示,试测验这组数据是否来自正态分布87 77 92 68 80 78 84 77 81 80 80 77 92 86 76 80 81 75 77 72 8
4、1 72 84 86 80 68 77 87 76 77 78 92 75 80 78 n=35第6页,共20页,编辑于2022年,星期五检验过程如下:检验过程如下:H0:健康成人男性血糖浓度服从正态分布健康成人男性血糖浓度服从正态分布H1:健康成人男性血糖浓度不服从正态分布健康成人男性血糖浓度不服从正态分布经计算,样本的均值经计算,样本的均值=80,标准差,标准差=6,这,这便可以作为对原假设,正态分布的参数估计便可以作为对原假设,正态分布的参数估计值,运用于检验计算中。值,运用于检验计算中。第7页,共20页,编辑于2022年,星期五D值序列的计算结果值序列的计算结果得到D统计量的值为0.1
5、754.然后查表判断是否拒绝原假设第8页,共20页,编辑于2022年,星期五2检验与Kolmogorov-Smirnov检验的区别2检验与检验与Kolmogorov-Smirnov检验都采用检验都采用实际频数和期望频数进行检验。它们之间最实际频数和期望频数进行检验。它们之间最大的区别在于前者主要用于类别数据,而后大的区别在于前者主要用于类别数据,而后者主要用于有单位的数量数据,有时前者也者主要用于有单位的数量数据,有时前者也可以用于数量数据但必须将数据分组得到实可以用于数量数据但必须将数据分组得到实际观测频数,并要求多变量之间独立,而后际观测频数,并要求多变量之间独立,而后者可以不分组直接把原
6、始数据进行检验因此者可以不分组直接把原始数据进行检验因此k-s检验对数据的应用较完整。检验对数据的应用较完整。第9页,共20页,编辑于2022年,星期五第10页,共20页,编辑于2022年,星期五 SPSS SPSS在统计中将计算在统计中将计算K-SK-S的的Z Z统计量,并依统计量,并依据据K-SK-S分布表(小样本)或正态分布表(大样本)分布表(小样本)或正态分布表(大样本)给出对应的相伴概率值。如果相伴概率小于或给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平等于用户的显著性水平,则应拒绝零假设,则应拒绝零假设H0H0,认为样本来自的总体与指定的分布有显著差,认为样本来自的总
7、体与指定的分布有显著差异;如果相伴概率值大于显著性水平,则不能异;如果相伴概率值大于显著性水平,则不能拒绝零假设拒绝零假设H0H0,认为样本来自的总体与指定的,认为样本来自的总体与指定的分布无显著差异。分布无显著差异。第11页,共20页,编辑于2022年,星期五单样本单样本K-SK-S检验可以将一个变量的实际频数分布检验可以将一个变量的实际频数分布与正态分布(与正态分布(NormalNormal)、均匀分布()、均匀分布(UniformUniform)、)、泊松分布(泊松分布(PoissonPoisson)、指数()、指数(ExponentialExponential)分布进行比较。分布进行比
8、较。第12页,共20页,编辑于2022年,星期五10.4.2 SPSS中实现过程中实现过程 研究问题研究问题 某地某地144144个周岁儿童身高数据如表个周岁儿童身高数据如表10-410-4所示,所示,问该地区周岁儿童身高频数是否呈正态分布?问该地区周岁儿童身高频数是否呈正态分布?第13页,共20页,编辑于2022年,星期五表表表表10-410-4儿童身高数据儿童身高数据儿童身高数据儿童身高数据身 高 区 间人 数642684697701671207225732474227616782796831第14页,共20页,编辑于2022年,星期五 实现步骤实现步骤图图图图10-12 10-12 在菜
9、在菜在菜在菜单单单单中中中中选择选择选择选择“1-Sample K-S”“1-Sample K-S”命令命令命令命令第15页,共20页,编辑于2022年,星期五图图图图10-13 “One-Sample Kolmogorov-Smirnov Test”10-13 “One-Sample Kolmogorov-Smirnov Test”对话对话对话对话框框框框有四种可作为原假设中理论分布的分布类型Options选项和精确检验选项。第16页,共20页,编辑于2022年,星期五图图图图10-14 “One-Sample K-S10-14 “One-Sample K-S:Options”Options
10、”对话对话对话对话框框框框第17页,共20页,编辑于2022年,星期五10.4.3 结果和讨论结果和讨论(1 1)本例输出结果如下表所示。)本例输出结果如下表所示。D统计量的数值Z值等于D*sqrt(n)近似相伴概率值等于0.681大于我们一般的显著水平0.05,则接受原假设,认为学生身高频数服从正态分布。注意:在样本数注意:在样本数少于少于50时,要求时,要求使用精确检验概使用精确检验概率值。率值。第18页,共20页,编辑于2022年,星期五作业!要求作业中,在进行要求作业中,在进行K-S检验时,结果中需要含有表明检验时,结果中需要含有表明值计算过程的表格(包括累积频率,理论累积分布函数,值
11、计算过程的表格(包括累积频率,理论累积分布函数,值序列并指明值序列并指明D 统计量的值),最后运用统计量的值),最后运用spss计算的相计算的相伴概率值,给出检验结果。伴概率值,给出检验结果。1.对于例一的正态性检验问题,运用对于例一的正态性检验问题,运用k-s检验的方法进行检验的方法进行检验。检验。2.运用运用k-s检验方法检验研究问题中,儿童的身高(检验方法检验研究问题中,儿童的身高(不是不是身高频数身高频数,处理数据时,如:处理数据时,如:“64”按按“64”处理处理)是否)是否服从正态分布。服从正态分布。3.据一家商场的调查报告记载了该商场一位售货员在一个工据一家商场的调查报告记载了该
12、商场一位售货员在一个工作日内接待的作日内接待的110位顾客中花费在每一位位顾客中花费在每一位第19页,共20页,编辑于2022年,星期五顾客的服务时间(单位:秒),如下表所示。根据数据顾客的服务时间(单位:秒),如下表所示。根据数据分别用卡方检验和分别用卡方检验和K-S检验,卡方检验检验,卡方检验检验花费在每一位检验花费在每一位顾客的服务时间是否服从顾客的服务时间是否服从指数分布指数分布?(?(卡方检验时,需要卡方检验时,需要给出分组和各分组取值的理论频率,最终通过给出分组和各分组取值的理论频率,最终通过spss计算计算出的相伴概率值作出检验结果出的相伴概率值作出检验结果)。)。第20页,共20页,编辑于2022年,星期五