试验数据的正态性检验数据的转换及其卡方检验.doc

上传人:小** 文档编号:3034074 上传时间:2020-06-23 格式:DOC 页数:20 大小:399.61KB
返回 下载 相关 举报
试验数据的正态性检验数据的转换及其卡方检验.doc_第1页
第1页 / 共20页
试验数据的正态性检验数据的转换及其卡方检验.doc_第2页
第2页 / 共20页
点击查看更多>>
资源描述

《试验数据的正态性检验数据的转换及其卡方检验.doc》由会员分享,可在线阅读,更多相关《试验数据的正态性检验数据的转换及其卡方检验.doc(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、,.试验数据的正态检验、数据的转换和卡方检验目录一、符合正态分布的例子1二、不符合正态分布的例子6三、不符合正态分布数据的转换及转换后数据的方差分析11四、次数分布资料的卡方检验14在对试验数据进行方差分析前,应对数据的三性(即同质性、独立性和正态性)进行检验。本文介绍对资料的正态性进行检验的方法,主要介绍3种检验方法:(1)频数检验作频率分布图、看偏度系数和峰度系数,(2)作Q-Q图检验,(3)非参数检验单个样本K-S检验。下面以两个试验数据为例,例1为84头育肥猪的体重数据,通常符合正态分布。例2为生长育肥猪7个试验处理组的腹泻率(百分数资料)统计结果,这类资料往往不符合正态,而大多数人以

2、为是符合正态分布,进行方差分析的,因而不能得出正确的结论,却可能得出错误结论。一、符合正态分布的例子【例1】 84头生长育肥猪的“体重”数据如表1-1,检验该数据是否呈正态分布。表1-1 84头育肥猪的“体重”数据(排序后)No.体重No.体重No.体重No.体重No.体重No.体重No.体重No.体重No.体重155.31171.62178.33181.24184.65188.66192.07199.481107.4258.21272.12278.73282.24284.75288.86292.072100.782109.0360.21372.82378.83382.44384.75389.

3、26392.273102.483112.8464.81473.62479.13482.84485.05489.96493.074103.084113.2565.81575.92579.33582.84585.35590.46594.275105.4666.71676.12679.73682.84685.75690.96695.376105.4767.91777.02780.23783.54786.45791.06797.077105.4868.41877.12880.63883.74886.85891.16897.878106.0970.11977.22981.13984.34987.3599

4、1.26 998.479106.21070.82078.13081.14084.45087.46091.47098.580107.3检验方法一:频数检验作频率分布图、看偏度系数和峰度系数步骤1:数据录入SPSS中,如图1-1。图1-1 体重数据录入SPSS中步骤2:在SPSS里执行“分析描述统计频率”,然后弹出“频率”对话框(图1-2a),变量选择“体重”; 再点右边的“统计量”按钮,弹出图“频率:统计量”对话框(图1-2b),选择“偏度”和“丰度”(图1-2b);再点右边的“图表”按钮,弹出图“频率:图表”对话框(图1-2c),选择“直方图”,并选中“在直方图显示正态曲线” 图1-2a “频

5、率”对话框 图1-2b “频率:统计量”对话框 图1-2c “频率:图表”对话框 设置完后点“确定”后,就会出来一系列结果,包括2个表格和一个图,我们先来看看“统计量”表,如下:统计量体重N有效84缺失0偏度.040偏度的标准误.263峰度-.202峰度的标准误.520偏度系数=0.040,峰度系数-0.202;两个系数都小于1,可认为近似于正态分布。再看直方图(图1-3),如下:图1-3 84头育肥猪体重的频数分布直方图图1-3中横坐标为“增重”,纵坐标为增重出现的“频数”。根据直方图及绘出的曲线,可以认为该数据近似正态分布。检验方法二:Q-Q图检验步骤1:数据录入SPSS中,如图1-1。步

6、骤2:在SPSS里执行“描述统计Q-Q图”,弹出“Q-Q图”对话框,变量选择“体重”,检验分布选择“正态”(见图1-4),其他选择默认,然后“确定”。 图1-4 “Q-Q图”对话框最后可以得到Q-Q图检验结果,结果很多,我们只需要看最后一个图,见图1-5 。所有数据几乎在一条直线上,表明近似正态分布。图1-5 84头生长育肥猪的正态Q-Q图检验方法三:非参数检验单个样本K-S检验步骤1:数据录入SPSS中,如图1-1。步骤2:在SPSS里执行“分析非参数检验旧对话框单个样本K-S检验”,弹出对话框,检验变量选择“期初平均分”,检验分布选择“常规”(即正态分布),然后点“确定”(图1-6)。图1

7、-6 单样本K-S检验对话框从以下结果可以看出,K-S检验中,Z值为0.563,渐近显著性(双侧) (即P值)=0.9090.05,因此数据呈近似正态分布。单样本 Kolmogorov-Smirnov 检验体重N84正态参数a,b均值85.9654标准差12.67824最极端差别绝对值.061正.061负-.056Kolmogorov-Smirnov Z.563渐近显著性(双侧).909a. 检验分布为正态分布。b. 根据数据计算得到。二、不符合正态分布的例子【例2】7个处理组,每个处理4个重复,每重复3头生长育肥猪全期(98天)的腹泻次数统计结果见表1-2。“腹泻率”统计结果,检验其是否符合

8、正态分布?(腹泻指数为每天有1头猪发生腹泻,记为1头次)。表2-1 生长育肥猪全期98天腹泻次数统计及腹泻率计算表分组重复(头数)饲养天数腹泻指数(腹泻头次)总指数(总头数)(=3*98)全期腹泻率%(=腹泻头次/总头次)1 3 98 3294 1.02 1 3 98 11294 3.74 1 3 98 2294 0.68 1 3 98 5294 1.70 2 2 3 98 10294 3.40 2 3 98 6294 2.04 2 3 98 6294 2.04 3 3 98 12294 4.08 3 3 98 7294 2.38 3 3 98 55294 18.71 3 3 98 12294

9、 4.08 4 3 98 23294 7.82 4 3 98 1294 0.34 4 3 98 2294 0.68 4 3 98 11294 3.74 5 3 98 74294 25.17 5 3 98 45294 15.31 5 3 98 83294 28.23 5 3 98 4294 1.36 6 3 98 7294 2.38 6 3 98 14294 4.76 6 3 98 6294 2.04 6 3 98 22294 7.48 7 3 98 73294 24.83 7 3 98 3294 1.02 7 3 98 4294 1.36 7 3 98 36294 12.24 检验方法一:频数

10、检验作频率分布图、看偏度系数和峰度系数步骤1:数据录入SPSS中,如图2-1。图2-1 腹泻率数据录入SPSS中步骤2:在SPSS里执行“分析描述统计频率”,然后弹出“频率”对话框(图2-2a),变量选择“腹泻率”; 再点右边的“统计量”按钮,弹出图“频率:统计量”对话框(图2-2b),选择“偏度”和“丰度”(图2-2b);再点右边的“图表”按钮,弹出图“频率:图表”对话框(图2-2c),选择“直方图”,并选中“在直方图显示正态曲线”图2-2a “频率”对话框 图2-2b “频率:统计量”对话框 图2-2c “频率:图表”对话框设置完后点“确定”,就后会出来一系列结果,包括2个表格和一个图,我

11、们先来看看“统计量”表,如下:统计量腹泻率N有效27缺失1偏度1.623偏度的标准误.448峰度1.433峰度的标准误.872偏度系数=1.623,峰度系数1.433;两个系数都大于1,可认为不服从正态分布。再看直方图(图2-3),如下:图2-3 腹泻率的频数分布直方图图2-3中横坐标为“腹泻率”,纵坐标为增重出现的“频数”。根据直方图可以看出,分布显然是偏态的,与正态分布曲线相差甚远。检验方法二:Q-Q图检验步骤1:数据录入SPSS中,如图2-1。步骤2:在SPSS里执行“描述统计Q-Q图”,弹出“Q-Q图”对话框,变量选择“腹泻率”,检验分布选择“正态”(见图2-4),其他选择默认,然后“

12、确定”。 图2-4 “Q-Q图”对话框最后可以得到Q-Q图检验结果,结果很多,我们只需要看最后一个图,见图2-5 。腹泻率数据不在一条直线上,表明不符合正态分布。图2-5 腹泻率的正态Q-Q图检验方法三:非参数检验单个样本K-S检验步骤1:数据录入SPSS中,如图2-1。步骤2:在SPSS里执行“分析非参数检验旧对话框单个样本K-S检验”,弹出对话框,检验变量选择“腹泻率”,检验分布选择“常规”(即正态分布),然后点“确定”(图2-6)。图2-6 单样本K-S检验对话框检验结果为:从结果可以看出,K-S检验中,Z值=1.544,渐近显著性(双侧) (即P值)=0.016Q-Q图”,弹出“Q-Q

13、图”对话框,变量选择“腹泻率”,检验分布选择“正态”,在转换中选择“自然对数转换”(见图3-1),其他选择默认,然后“确定”。 图3-1 腹泻率自然对换转换后的“Q-Q图”对话框输出结果见图3-2。可见所有数据几乎在一条直线上,可认为近似正态分布。图3-2腹泻率自然对换转换后的“Q-Q图”3.2 对自然对数转换后的数据作频率分布图、看偏度系数和峰度系数将以上【例2】的腹泻率数据时行自然对数转换,结果如下表。分组重复(头数)饲养天数腹泻指数(腹泻头次)总指数(总头数)全期腹泻率自然对数转换后的腹泻率1 3 98 3294 1.02 0.02 1 3 98 11294 3.74 1.32 1 3

14、98 2294 0.68 -0.39 1 3 98 5294 1.70 0.53 2 2 3 98 10294 3.40 1.22 2 3 98 6294 2.04 0.71 2 3 98 6294 2.04 0.71 3 3 98 12294 4.08 1.41 3 3 98 7294 2.38 0.87 3 3 98 55294 18.71 2.93 3 3 98 12294 4.08 1.41 4 3 98 23294 7.82 2.06 4 3 98 1294 0.34 -1.08 4 3 98 2294 0.68 -0.39 4 3 98 11294 3.74 1.32 5 3 98

15、 74294 25.17 3.23 5 3 98 45294 15.31 2.73 5 3 98 83294 28.23 3.34 5 3 98 4294 1.36 0.31 6 3 98 7294 0.024 -3.738 6 3 98 14294 0.048 -3.045 6 3 98 6294 0.020 -3.892 6 3 98 22294 0.075 -2.593 7 3 98 73294 0.248 -1.393 7 3 98 3294 0.010 -4.585 7 3 98 4294 0.014 -4.297 7 3 98 36294 0.122 -2.100 自然对数转换后腹

16、泻率的频率分布图(直方图)、偏度系数和峰度系数如下:图3-3 自然对数转换后的腹泻率的直方图(近似正态分布)统计量自然对数转后的腹泻率N有效27缺失57偏度.212偏度的标准误.448峰度-.656峰度的标准误.872自然对数转换后的腹泻率的偏度系数=0.213,峰度系数=-0.656,均小于1.0,表明符合正态分布。3.3 数据转换前后的方差分析结果的比较腹泻率数据转换前与转换后的各组平均数如下:描述性统计量分组均值标准 偏差N腹泻率11.78501.37058422.4933.78520337.31257.64048443.14503.471504517.517512.10036464.1

17、6502.51960479.862511.257014总计6.76418.3021327自然对数转后的腹泻率1.3700.7367042.8800.29445331.6550.8873044.47751.45973452.40251.42003461.2875.60665471.51131.585384总计1.23911.1991927SPSS一般线性模型方差分析结果如下:主体间效应的检验源因变量III 型平方和df均方FSig.分组腹泻率735.4436122.5742.320.073自然对数转后的腹泻率12.14062.0231.603.198误差腹泻率1056.6152052.831自然

18、对数转后的腹泻率25.250201.262总计腹泻率3027.38127自然对数转后的腹泻率78.84327方差分析结果显示:腹泻率数据转换前的P=0.0730.05,差异不显著;而转换后的腹泻率P=0.1980.05,仍然差异不显著。四、次数分布资料的卡方检验以上猪腹泻次数统计数据属于次数性资料,虽然换算成百分数后属于连续性资料,但经检验,不满足正态分布,因此不宜采用方差分析来检验各组腹泻率差异的显著性。而经自然对数转换后,腹泻率基本满足正态分布条件,可采用方差分析。但无论是转换前还转换后的腹泻率百分数资料,经以上方差分析显示,各组间腹泻率均差异不显著。因此,有必要寻求其他种检验方法次数性资

19、料的差异显著检验方法卡方检验来试一试。表4-1 生长育肥猪(98天)腹泻次数统计表分组头数饲养天数腹泻指数(腹泻头次)总指数(总头数)全期腹泻率1 12982111761.79%2 998228822.49%3 12988611767.31%4 1298206117617.52%5 12984911764.17%6 129811611769.86%7 12983711763.15%表 4-2 生长育肥猪(98天)腹泻次数资料卡方检验表腹泻次数观察值分组腹泻头次(n1)正常头次(n2)合计头次(N)腹泻率1 21115511761.79%2 228608822.49%3 86109011767.

20、31%4 206970117617.52%5 49112711764.17%6 116106011769.86%7 37113911763.15%合计53774017938比例0.0680.9321腹泻次数理论值计算结果分组腹泻头次(n1)正常头次(n2)合计头次(N)1 79.61096.41176.02 59.7822.3882.03 79.61096.41176.04 79.61096.41176.05 79.61096.41176.06 79.61096.41176.07 79.61096.41176.0合计537.07401.07938.0腹泻次数卡方值计算结果分组腹泻头次(n1)正常头次(n2)合计头次(N)1 43.103.1346.232 23.781.7325.503 0.520.040.564 200.9714.58215.555 11.740.8512.596 16.701.2117.917 22.761.6524.42合计319.5623.19342.75合计卡方值=342.75,查卡方分布表知其对应的P值=5.56E-71,差异极显著。该检验结果与前面方差分析结果大相径庭(见第三部分:不符合正态分布数据的转换及转换数据的方差分析)。后记:可见以上腹泻次数资料(腹泻率百分数资料)不宜采用方差分析,而应考虑采用卡方检验。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 其他杂项

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁