《SPSS数据正态性检验解析.ppt》由会员分享,可在线阅读,更多相关《SPSS数据正态性检验解析.ppt(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、SPSS数据正态性检验解析,例:请对某大学学生的身高资料进行分析,是否符合正态分布,1.,2.,3.,结果部分:,解析: 偏度0,尾部向右延伸 偏度0 比正态分布的高峰更加陡峭尖顶峰(瘦)峰度0 比正态分布的高峰来得平台平顶峰(胖),SAS规定:n2000,以Shapiro-Wilk(W检验)为准;n2000,以Kolmogorow-Smirnov(D检验)为准,如果整个图逆时针转90度,就变成变相的直方图,也是反映分布形态的,但信息含量远大于直方图(分布及数值大小)。 以倒数第二行为例,最左边的17是指右边的小数点后面有17个数字。17是茎,0001114是17个树叶,最后一行主干宽度是10
2、,意味上面数字得放大10倍,意思是有3个180,3个181。 &为零碎叶子的标志。因叶子太小或太大无法在图中显示,用 &表示。,解读: P-P图反映了变量的实际累积概率与理论累积概率的符合程度,Q-Q图反映了变量的实际分布与理论分布的符合程度,两者意义相似,都可以用来考察数据资料是否服从某种分布类型。若数据服从正态分布,则数据点应与理论直线(即对角线)基本重合。 本例数据很多不在参考线上,不符合正态分布,与前W检验结果一致。,P-P图,Q-Q图,注意: 事实上,Shapiro-Wilk检验及Kolmogorov-Smirnov检验从实用性的角度,远不如图形工具进行直观判断好用。在使用这两种检验
3、方法的时候要注意: 当样本量较少的时候,检验结果不够敏感,即使数据分布有一定的偏离也不一定能检验出来; 当样本量较大的时候,检验结果又会太过敏感,只要数据稍微有一点偏离,P值就会0.05,检验结果倾向于拒绝原假设,认为数据不服从正态分布。 如果样本量足够多,即使检验结果P0.05,数据来自的总体也可能是服从正态分布的。 因此,在实际的应用中,往往会出现这样的情况,明明直方图显示分布很对称,但正态性检验的结果P值却0.05,拒绝原假设认为不服从正态分布。此时建议不要太刻意追求正态性检验的P值,一定要参考直方图、P-P图等图形工具来帮助判断。很多统计学方法,如T检验、方差分析 等,与其说要求数据严
4、格服从正态分布,不如说“数据分布不要过于偏态”更为合适。 经验法: 一般正态分布的标准差不会大于均值的1/3,这是目测判断法,最终还是要经过检验,但如果标准差都大于均数,一般不太可能正态分布。,发现异常值!,P75,P50,P25,虽然箱式图一般用于判定数据是否存在异常值,但如果细心,上方很多离群值,数据像大的方向拖尾,结果与直方图判读一致。,按照SPSS默认选项,如果所有数据都在四分位点1.5倍盒子长度内,则线的端点为最大值和最小值,否则线长度就是1.5倍盒子长度(盒子长度等于四分位间距),在其外的值单独点出(1.5倍用圈圈表示可疑值,3倍用*表示异常值),部分案例参考精鼎数据分析联盟、医咖会,详细文章请参考相关微信公众号,