《spss基础统计描述.ppt》由会员分享,可在线阅读,更多相关《spss基础统计描述.ppt(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、基础统计描述电子工业出版社电子工业出版社提 纲1.1.数理统计量概述2.2.数据描述3.3.频数分析4.4.探索分析5.5.交叉列联表分析提 纲6.6.比率分析7.7.P-P图、Q-Q图8.8.本章小结数理统计量概述nSPSS在描述性统计分析中,提供了多个统计量来描述数据特征,这些统计量包括均值、中位数、众数、方差、标准差、四分位数、十分位数、百分位数、峰度系数、偏度系数等。在进行描述性统计分析之前,首先要对这些统计量在统计学上的定义及其计算公式有所了解。数理统计量概述n均值(Mean)和均值标准误差(S.E.mean)均值(平均数、平均值)表示的是某个变量所有取值的 均值标准误差(Stand
2、ard Error of Mean,S.E.mean,简称标准误)就是描述这些样本均值与总体均值之间平均差异程度的统计量。集中趋势或平均水平。数理统计量概述n中位数(Median)中位数是将总体数据的各个数值按大小顺序排列,居于中间位置的变量,用Median表示。中位数将所有的数据等分成两半,中位数两端的数据个数相同,因此它也被称为二分位数。中位数的确定,仅仅取决于它在数列中的位置,不受极端值的影响;因此,可以用它表示总体的一般水平。同时,中位数比算术平均数具有更好的稳定性。数理统计量概述n众数(Mode)众数是指总体数据中出现次数最多的变量,用Mode表示。它同样不受数据极端值的影响,从而在
3、一定程度上提高了平均水平的代表性。例如,制衣厂可以根据消费者的所需服装尺码的众数来安排生产。此外,如果众数的值出现的频数或频率较大,那么说明此众数的代表性就越高,数列的集中趋势也就越显著。数理统计量概述n全距(Range)全距,又称范围,是数据的最大值(Maximum)与最小值(Minimum)之间的绝对差,借以表明总体标志值最大可能的差异范围。全距越长,说明数据越离散;反之,全距越小,说明数据越集中。数理统计量概述n方差(Variance)和标准差(Standard Deviation)方差是总体所有变量值与其算术平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的
4、平方根,它表示了一组数据关于平均数的平均离散程度。数理统计量概述n峰度(Kurtosis)和偏度(Skewness)峰度是描述总体数据所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比较为平坦,为平顶峰。峰度的绝对值数值越大,表示其分布形态的陡缓程度与正态分布的差异度越大。偏度与峰度类似,它也是描述数据分布形态的统计量,其描述的是某总体取值分布的对称性。数理统计量概述n四分位数(Quartiles)、十分位数(Deciles
5、)和百分位数(Percentiles)四分位数是将一组数据由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与这3个点位置上相对应的数值称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数,即中位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差,记为Q。四分位差越小,说明中间部分的数据越集中;四分位数越大,则意味着中间部分的数据越分散。数理统计量概述n四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles)与四分位数类似,十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为10等份,与这9个
6、点位置上相对应的数值称为十分位数,分别记为D1,D2,D9,表示10%的数据落在D1下,20%的数据落在D2下,90%的数据落在D9下。数理统计量概述n四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles)同理,百分位数是将一组数据由小到大(或由大到小)排序后分割为10 等份,与99个分割点位置上相对应的数值称为百分位数,分别记为P1,P2,P99,表示1%的数据落在P1下,2%的数据落在P2下,99%的数据落在P99下。数据描述n描述性统计分析是对数据进行基础性的描述。通过得出的数据的平均值(Mean)、和(Sum)、标准差(Std deviation
7、)、最大值(Max)、最小值(Min)、方差(Variance)、全距(range)、平均值标准误(S.E.Mean)、峰度(Kurtosis)、偏度(Skewness)等统计量,来估计原始数据的集中程度、离散状况、分布情况。频数分析n对于一组数据,考察不同的数值出现的频数,或者是数据落入指定区域内的频数,可以了解数据的分布状况。SPSS 17.0提供了“频数分析”这一功能。通过频数分析,用户在得到描述性统计结果的同时,还能使用户了解变量取值的分布情况,从而使总体数据的分布通过频数分析出的数字得到更为清晰、准确的输出。探索分析n探索分析是在对数据的基本特征统计量有初步了解的基础上,对数据进行的
8、更为深入、详细的描述性观察分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致和全面,有助于用户思考对数据进行进一步分析的方案。交叉列联表分析n在实际分析中,除了需要对单个变量的数据分布情况进行分析外,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。比率分析n比率分析主要用于对两变量间变量值的比率变化进行描述分析,适用于定距型变量(scale)。比如,可以对受处分的学生和没受处分的学生的上网时间与用计算机的时间进行比率分析。P-P图、Q-Q图nP-P图是根据变量的累积比例与指定分布的累积比例之间的关系所绘制的图形。通过P-P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P图中各点近似成一条直线。如果P-P图中各点不成直线,但有一定规律,可以对变量数据进行转换,使转换后的数据更接近指定分布。P-P图、Q-Q图nQ-Q图同样可以用于检验数据的分布,所不同的是,Q-Q图是用变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进行检验的。本章小结n本章介绍了“分析菜单”下,“描述性统计”命令的各种功能的用途和用法。通过本章对描述性统计基础方法的学习,读者可以在数据的基础上,运用描述原始数据集中程度、离散状况、分布情况的统计量,对数据的总体特征进行归纳。