第二章SAS的描述统计功能.ppt

上传人:s****8 文档编号:66867052 上传时间:2022-12-21 格式:PPT 页数:80 大小:1,004.50KB
返回 下载 相关 举报
第二章SAS的描述统计功能.ppt_第1页
第1页 / 共80页
第二章SAS的描述统计功能.ppt_第2页
第2页 / 共80页
点击查看更多>>
资源描述

《第二章SAS的描述统计功能.ppt》由会员分享,可在线阅读,更多相关《第二章SAS的描述统计功能.ppt(80页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程第二章 SAS的描述统计功能n2.1 描述性统计的基本概念描述性统计的基本概念n2.2 在在SAS中计算统计量中计算统计量n2.3 统计图形统计图形STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.1 2.1 描述性统计的基本概念描述性统计的基本概念n2.1.1 2.1.1 统计学的基本概念统计学的基本概念n2.1.2 2.1.2 表示数据位置的统计量表示数据位置的统计量n2.1.3 2.1.3 表示数据分散程度的统计量表示数据分散程度的统计量n2.1.4 2.1.4 表示数据分

2、布形状的统计量表示数据分布形状的统计量n2.1.5 2.1.5 其它统计量其它统计量STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.1 统计学的基本概念统计学的基本概念1.1.总体与样本总体与样本 总总体体(population):总总体体是是指指所所研研究究对对象象的的全全体体组组成成的集合。的集合。样样本本(sample):样样本本是是指指从从总总体体中中抽抽取取的的部部分分对对象象(个个体体)组组成成的的集集合合。样样本本中中包包含含个个体体的的个个数数称称为为样样本本容容量量。容容量量为为n的的样样本本常常用用n个个随随机机变变量量X1,X2,X

3、n表表示示,其其观观测测值值(样样本本数数据据)则则表表示示为为x1,.,xn,为为简单起见,有时不加区别。简单起见,有时不加区别。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.参数与统计量参数与统计量 参参数数(parameter):参参数数是是用用来来描描述述总总体体特特征征的的概概括括性性值值。如如总总体体平平均均值值()、总总体体方方差差(2)、总总体体比比例(例()等。)等。统统计计量量(statistics):统统计计量量是是用用来来描描述述样样本本特特征征的的概概括括性性值值。如如样样本本均均值值()、样样本本方方差差(s2)、样样本本比

4、比例(例(P)等。)等。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.2 表示数据位置的统计量表示数据位置的统计量 如如果果要要用用简简单单的的数数字字来来概概括括一一组组观观测测数数据据x1,.,xn,可可以以使使用用“位位置置统统计计量量”来来作作为为数数据据的的总总体体代代表表,常常见的位置统计量有:均值、中位数、分位数、众数等。见的位置统计量有:均值、中位数、分位数、众数等。1.1.均值(均值(MeanMean)均均值值是是所所有有观观测测值值的的平平均均值值,是是描描述述数数据据取取值值中中心心位位置的一个度量:置的一个度量:STATSTAT

5、STATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.中位数(中位数(MedianMedian或或MedMed)中中位位数数是是描描述述观观测测值值数数据据中中心心位位置置的的统统计计量量,大大体体上上比比中中位位数数大大(小小)的的数数据据为为观观测测值值的的一一半半。中中位位数数的的一一个个优优点点是是它它不不受受个个别别极极端端数数据据的的影影响响,具具有有稳稳健健性性。中中位位数数的的计计算算方方法法是是:首首先先将将数数据据从从小小到到大大排排序序为为:x(1),.,x(n),然后计算,然后计算STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计

6、应用教程3.3.众数(众数(ModeMode)观观测测值值中中出出现现最最多多的的数数称称为为众众数数。众众数数用用得得不不如如均均值值和和中中位位数数普普遍遍。在在属属性性变变量量分分析析中中,常常需需考考虑虑频频数数,因因此众数用得多些。此众数用得多些。4.4.百分位数(百分位数(PercentilePercentile)分分位位数数也也是是描描述述数数据据分分布布和和位位置置的的统统计计量量。0.5分分位位数数就就是是中中位位数数,0.75分分位位数数和和0.25分分位位数数又又分分别别称称为为上上、下四分位数,并分别记为下四分位数,并分别记为Q3和和Q1。STATSTATSTATSTA

7、TSASSAS软件与统计应用教程软件与统计应用教程2.1.3 表示数据分散程度的统计量表示数据分散程度的统计量1.1.极差(极差(RangeRange)与半极差()与半极差(InterquartileInterquartile range range)极差就是数据中的最大值和最小值之间的差:极差就是数据中的最大值和最小值之间的差:极差极差=maxxi minxi 上上、下下四四分分位位数数之之差差Q3 Q1称称为为四四分分位位极极差差或或半半极极差,它描述了中间半数观测值的散布情况。差,它描述了中间半数观测值的散布情况。2.2.方差(方差(VarianceVariance或或VarVar)方方

8、差差是是由由各各观观测测值值到到均均值值距距离离的的平平方方和和除除以以观观测测量量减减1:STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.标准差(标准差(Standard deviationStandard deviation或或Std DevStd Dev)方差的开方称为标准差:方差的开方称为标准差:标准差的量纲与原变量一致。标准差的量纲与原变量一致。4.4.变异系数(变异系数(Coefficient of VariationCoefficient of Variation或或CVCV)变变异异系系数数是是将将标标准准差差表表示示为为均均值值的的百百

9、分分数数,是是观观测测数数据据分分散散性性的的一一个个度度量量,它它在在比比较较用用不不同同单单位位测测量量的的数数据据的分散性时是有用的:的分散性时是有用的:STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.4 表示数据分布形状的统计量表示数据分布形状的统计量 偏度和峰度是描述数据分布形状的指标。偏度和峰度是描述数据分布形状的指标。1.1.偏度(偏度(skewnessskewness)偏度是刻画数据对称性的指标。偏度的计算公式为:偏度是刻画数据对称性的指标。偏度的计算公式为:在在SAS中:中:关于均值对称的数据其偏度为关于均值对称的数据其偏度为0;左侧更

10、为分散的数据,其偏度为负,称为左偏;左侧更为分散的数据,其偏度为负,称为左偏;右侧更为分散的数据,其偏度为正,称为右偏。右侧更为分散的数据,其偏度为正,称为右偏。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.峰度(峰度(kurtosiskurtosis)峰峰度度描描述述数数据据向向分分布布尾尾端端散散布布的的趋趋势势。峰峰度度的的计计算算公公式为:式为:利利用用峰峰度度研研究究数数据据分分布布的的形形状状是是以以正正态态分分布布为为标标准准(假假定定正正态态分分布布的的方方差差与与所所研研究究分分布布的的方方差差相相等等)比比较较两端极端数据的分布情况

11、,若两端极端数据的分布情况,若 近似于标准正态分布,则峰度接近于零;近似于标准正态分布,则峰度接近于零;尾部较正态分布更分散,则峰度为正,称为轻尾;尾部较正态分布更分散,则峰度为正,称为轻尾;尾部较正态分布更集中,则峰度为负,称为厚尾。尾部较正态分布更集中,则峰度为负,称为厚尾。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.5 其它统计量其它统计量1.1.均均值值的的标标准准误误(Std Std Error Error MeanMean或或Std Std MeanMean或或Std Std errorerror)2.2.校正平方和(校正平方和(Corr

12、ected sum of squaresCorrected sum of squares)STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.未校正平方和(未校正平方和(Uncorrected sum of squaresUncorrected sum of squares)4.4.k k阶原点矩阶原点矩其中其中A1即为均值即为均值 。5.5.k k阶中心矩阶中心矩STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.2 2.2 在在SASSAS中计算统计量中计算统计量n2.2.1 用用INSIGHT计算统计量计算统计量n2.

13、2.2 用用“分析家分析家”计算统计量计算统计量n2.2.3 编程实现描述性统计编程实现描述性统计STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.1 用用INSIGHT计算统计量计算统计量 INSIGHT可以非常方便地计算各种统计量。可以非常方便地计算各种统计量。1.1.实例数据实例数据【例例2-1】表表2-1为为两两个个不不同同地地区区居居民民家家庭庭收收入入和和支支出出情情况况的的抽抽样样调调查查(单单位位:元元),试试分分别别统统计计收收入入和和支支出出情情况。况。将将表表2-1中中数数据据通通过过Excel导导入入到到SAS数数据据集集Mylib

14、.sryzc中中,4个个变变量量名名分分别别为为:ID、R_ID、Income和和Outgo,相相应应的的标标签签名名为为家家庭庭编编号号、地地区区编编号号、家家庭庭总总收收入入和和家家庭总支出。庭总支出。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程家庭编号地区编号家庭总收入家庭总支出家庭编号地区编号家庭总收入家庭总支出1217941550162220020602217161365171273022363134102730181249614554217651530191176010405221841900201282023666220502050212225

15、01966722460218422131702400811976117023212001250912850249624217761350101427527602521980179411220101275261245525501212236181027210801380131330528202821986120014124001976291336923051522250197030215301316STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.在在INSIGHTINSIGHT中打开数据集中打开数据集 在在 菜菜 单单 中中 选选 择择“Solution(

16、解解 决决 方方 案案)”“Analysis(分分 析析)”“Interactive Data Analysis(交交互互式式数数据据分分析析)”,打打开开“SAS/INSIGHT Open”对对话话框框,在在对对话话框框中中选选择择数数据据集集:Mylib.sryzc,单单击击“Open(打打开开)”按按钮钮,即即可可在在INSIGHT中中打打开开数数据窗口,如图所示。据窗口,如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.计算统计量计算统计量 选选 择择 菜菜 单单“Analyze(分分 析析)”“Distribution(Y)(分分布布)

17、”,打打开开“Distribution(Y)”对对话话框框。在在数数据据集集sryzc的的变变量量列列表表中中,选选择择Income为为分分析析变变量量,选择选择R_Id,为分组变量。,为分组变量。单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中包包含描述性统计量选项。含描述性统计量选项。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 选选择择选选项项矩矩统统计计量量和和分分位位数数,取取消消默默认认的的选选项项:“Box Plot/Mosaic Plot”和和“Histogram/Bar Chart”,单单击击“OK”按按钮钮,

18、即即可可得得到到变变量量Income按按“R_Id”分分组组的的各各种种矩矩统统计计量量(Moments)和和分分位位数数(Quantiles),如如图所示。图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.2 用用“分析家分析家”计算统计量计算统计量1.1.启动启动“分析家分析家”选选 择择 主主 菜菜 单单“Solutions(解解 决决 方方 案案)”“Analysis(分分析析)”“Analyst(分分析析家家)”,打开,打开“分析家分析家”窗口。窗口。选选 择择 主主 菜菜 单单“File(文文 件件)”“Open By SAS Name

19、”,打打开开“Select A Member”对对话话框框,选选择择数数据据集集Mylib.sryzc。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.通通过过Summary Summary StatisticsStatistics菜菜单单计计算算描描述述性性统统计计量量 选选择择主主菜菜单单“Statistics(统统计计)”“Descriptive(描描 述述 性性 统统 计计)”“Summary Statistics(汇汇总总统统计计量量)”,打打开开“Summary Statistics”对对话话框框,选选择择变变量量列列表表中中的的Income

20、,单单击击“Analysis”按钮,选定分析变量,如图所示。按钮,选定分析变量,如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程单单击击“Statistics”按按钮钮,打打开开“Summary Statistics:Statistics”对对话话框框。对对话话框框中中列列出出可可以以计计算算的的所所有有统统计计量(如右图所示)。量(如右图所示)。描述性统计量如下图所示。描述性统计量如下图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.通过通过DistributionsDistributions菜单计算描述

21、性统计量菜单计算描述性统计量 选选择择主主菜菜单单“Statistics(统统计计)”“Descriptive(描描述述性性统统计计)”“Distributions(分分布布)”,打打开开“Distributions”对对话话框框,选选择择变变量量列列表表中中的的Income,单击,单击“Analysis”按钮,选定分析变量。按钮,选定分析变量。单单击击“OK”按按钮钮,即即可可得得到到关关于于变变量量Income的的矩矩统统计计量和基本统计测度量和基本统计测度STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.3 编程实现描述性统计编程实现描述性统计 SA

22、S提提供供有有多多个个不不同同的的过过程程来来实实现现统统计计量量的的计计算算,它它们们在在功功能能范范围围上上有有许许多多的的重重复复,下下面面介介绍绍用用FREQ、MEANS和和UNIVARIATE这这三三个个过过程程来来计计算算简简单单的的描描述述统计量。统计量。FREQ过过程程常常用用来来计计算算分分类类变变量量取取值值的的频频数数,而而MEANS和和UNIVARIATE过过程程则则对对数数值值型型变变量量计计算算均均值值、标准差等统计量。标准差等统计量。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.FREQ1.FREQ过程过程 FREQ过过程程包

23、包括括多多个个控控制制频频数数输输出出与与检检验验的的语语句句和和选选项,格式如下:项,格式如下:PROC FREQ DATA=;TABLES ;FORMAT .;RUN;其其中中PROC FREQ语语句句调调用用FREQ过过程程,标标志志FREQ过程的开始;过程的开始;TABLES语语句句用用于于创创建建有有关关变变量量所所构构成成的的各各种种表表格格并并进行相应的假设检验和计算,可以多次使用。进行相应的假设检验和计算,可以多次使用。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 例例如如,统统计计数数据据集集Mylib.sryzc中中变变量量R_Id和和I

24、ncome频数的代码如下:频数的代码如下:proc freq data=mylib.sryzc;tables R_Id Income;RUN;显示结果如图所示。显示结果如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.MEANS2.MEANS过程过程(1)语法格式语法格式 MEANS过程的一般格式过程的一般格式:PROC MEANS DATA=;VAR;BY;CLASS;RUN;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 PROC MEANS语语句句后后的的选选项项主主要要用用来来指指定定所所要要计计算算的的统统

25、计计量量,默默认认情情况况下下,MEANS过过程程会会给给出出频频数数、均均数数、标标准准差差、最最大大值值和和最最小小值值等等,其其余余统统计计量量的的计计算算均均需要在选项中指定。需要在选项中指定。VAR语语句句引引导导所所要要进进行行分分析析的的所所有有变变量量的的列列表表,SAS将将对对VAR语语句句所所引引导导的的所所有有变变量量分分别别进进行行描描述述性性统统计计分分析。析。BY语语句句与与CLASS语语句句所所指指定定的的分分类类变变量量用用来来进进行行分分组统计,但输出格式不同。组统计,但输出格式不同。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用

26、教程 如如对对数数据据集集Mylib.sryzc中中的的Income变变量量计计算算简简单单统统计计量,只要用如下量,只要用如下MEANS过程:过程:proc means data=mylib.sryzc;var Income;run;结果如图结果如图2-15所示。所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2)使用统计量关键字列表使用统计量关键字列表 在在PROC MEANS语句中使用统计量关键字列表:语句中使用统计量关键字列表:proc means data=mylib.sryzc n mean median p1 p5 p95 p99 q1 q

27、3 max min;var Income;run;结果如图结果如图2-16所示。所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 可以计算的描述性统计量关键字及其含义见下表。可以计算的描述性统计量关键字及其含义见下表。关键字所代表的含义关键字所代表的含义n有效数据记录数range极差nmiss缺失数据记录数skewness偏度mean均值kurtosis峰度std标准差t分布位置假设检验之t统计量stderr标准误probt上述t统计量对应的概率值var方差q1第一四分位数median中位数q3第三四分位数mode众数qrange四分位数间距cv变异系数p

28、1第一百分位数max最大值p5第五百分位数min最小值p10第十百分位数sum总计p90第九十百分位数sumwgt加权值总计p95第九十五百分位数css校正平方和p99第九十九百分位数uss未校正平方和STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3)使用使用CLASS语句和语句和BY语句语句 使使用用CLASS语语句句和和BY语语句句可可以以分分组组计计算算分分析析变变量量的的描描述述统统计计量量值值,由由CLASS语语句句和和BY语语句句指指定定的的变变量量在在分分析析中中起起分分组组(类类)的的作作用用,被被称称为为分分类类变变量量。两两个个语语句的区

29、别是:句的区别是:使使用用BY语语句句时时要要求求数数据据集集须须按按BY变变量量排排序序,使使用用CLASS语句无此要求。语句无此要求。使使用用BY语语句句时时输输出出按按BY变变量量的的每每个个值值分分别别提提供供一一个表,使用个表,使用CLASS语句则将所有结果排列在一个表之中。语句则将所有结果排列在一个表之中。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 使使用用BY语语句句之之前前先先排排序序,如如下下代代码码可可以以在在上上例例中中按按变量变量R_Id分组统计:分组统计:proc sort data=mylib.sryzc;by R_Id;run

30、;proc means data=mylib.sryzc n mean median p1 p5 p95 p99 q1 q3 max min;var Income;by R_Id;run;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 使使用用CLASS语语句句分分组组较较为为简简单单,如如下下代代码码也也可可以以在在上上例中按变量例中按变量R_Id分组统计:分组统计:proc means data=mylib.sryzc n mean median p1 p5 p95 p99 q1 q3 max min;var Income;class R_Id;RUN;S

31、TATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.UNIVARIATE3.UNIVARIATE过程过程 UNIVARIATE过程的一般格式为:过程的一般格式为:PROC UNIVARIATE DATA=;VAR;BY|CLASS;HISTOGRAM/;OUTPUT OUT=;RUN;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 UNIVARIATE过过程程和和MEANS过过程程的的格格式式非非常常相相似似,相相同同的的语语句句和和选选项项其其含含义义也也相相同同,所所不不同同的的是是某某些些统统计计量量只只能能在在UNIVAR

32、IATE过过程程中中计计算算(如如众众数数),而而且且UNIVARIATE过程中具有绘图功能。过程中具有绘图功能。其其中中,HISTOGRAM语语句句用用来来指指示示SAS对对其其后后所所指指定定的的变变量量绘绘制制直直方方图图,其其后后的的选选项项用用来来指指示示SAS添添加加不不同同类型的拟合图形(如正态分布的分布密度曲线)。类型的拟合图形(如正态分布的分布密度曲线)。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 输出包括五个部分。输出包括五个部分。第一部分是矩统计量,各统计量已在第一部分是矩统计量,各统计量已在2.1.1中作了介绍。中作了介绍。第第二二

33、部部分分为为基基本本的的位位置置和和分分散散程程度度统统计计量量,位位置置统统计计量量包包括括均均值值、中中位位数数、众众数数,分分散散程程度度统统计计量量包包括括标标准准差、方差、极差、四分位间距差、方差、极差、四分位间距 第第三三部部分分为为关关于于均均值值等等于于零零的的三三种种检检验验的的结结果果,包包括括t检验、符号检验和符号秩检验。检验、符号检验和符号秩检验。第四部分为各个重要的分位数。第四部分为各个重要的分位数。第五部分是观测数据的五个最低值和五个最高值。第五部分是观测数据的五个最低值和五个最高值。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n

34、2.3 2.3 统计图形统计图形n2.3.1 定量变量的图形表示定量变量的图形表示n2.3.2 分类变量的图形表示分类变量的图形表示STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.3.1 定量变量的图形表示定量变量的图形表示1.1.直方图直方图 对对于于数数值值型型变变量量,常常用用直直方方图图(histogram)来来展展示示变变量量取取值值的的分分布布。将将变变量量取取值值的的范范围围分分成成若若干干区区间间,在在等等间间隔隔区区间间的的情情况况,每每个个区区间间的的长长度度称称为为组组距距。考考察察数数据据落落入入每每一一区区间间的的频频数数与与频频率

35、率,在在每每个个区区间间上上画画一一个个矩矩形形,它它的的宽宽度度是是组组距距,它它的的高高度度可可以以是是频频数数、频频率率或或密密度度(频频率率组组距距),在在高高度度是是密密度度的的情情况况,每每一一矩矩形形的的面面积积恰恰是是数数据据落落入入区区间间的的频频率率,这这种种直直方方图图可可以以估估计计总总体的概率密度。体的概率密度。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程图2-22 密度直方图与频数直方图SAS软软件件会会根根据据样样本本容容量量在在样样本本取取值值范范围围内内自自动动地地确确定定一个分组方式,另外也提供了设定分组的方法。一个分组方

36、式,另外也提供了设定分组的方法。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.盒形图盒形图 盒盒形形图图(boxplot,又又称称箱箱图图、箱箱线线图图、盒盒子子图图)是是用用更更为为简简洁洁的的方方法法表表现现数数据据在在数数轴轴上上的的分分布布及及其其特特点点的的图图形。形。图图2-23的的左左边边是是根根据据居居民民家家庭庭的的收收入入情情况况所所绘绘的的盒盒形形图;右边是分地区情况所绘的盒形图。图;右边是分地区情况所绘的盒形图。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.散点图散点图 通通常常得得到到

37、的的数数据据可可能能有有两两个个变变量量,比比如如家家庭庭的的收收入入和和支支出出情情况况的的数数据据,这这里里家家庭庭总总收收入入是是一一个个变变量量,而而家家庭庭总总支支出出是是第第二二个个变变量量。希希望望通通过过图图形形了了解解收收入入和和支支出出的的关关系系,这这时时可可以以用用一一个个变变量量为为横横坐坐标标(如如家家庭庭总总收收入入),另另一一个个为为纵纵坐坐标标(这这里里是是家家庭庭总总支支出出)来来作作图图(图图2-24)。这种图称为散点图)。这种图称为散点图(Scatter Plot)。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.

38、线图线图 线线图图(Line Plot)用用来来表表示示变变量量间间的的取取值值变变化化情情况况,有有单式和复式两种(图单式和复式两种(图2-25)。)。在在复复式式线线图图中中可可用用不不同同颜颜色色的的实实线线来来标标志志区区别别,如如图图2-25右所示。右所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.3.2 分类变量的图形表示分类变量的图形表示 分分类类变变量量也也可可以以通通过过图图形形直直观观地地描描绘绘出出它它们们各各类类的的数数量和所占比例,常用的有条形图、饼图和马赛克图。量和所占比例,常用的有条形图、饼图和马赛克图。1.1.条形图条形

39、图 条条形形图图(Bar Chart)给给出出分分类类变变量量取取每每个个值值的的频频数数,如如图图2-26所示为变量所示为变量R_ID取值的条形图。取值的条形图。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.饼图饼图 通通常常,饼饼图图(Pie Chart)可可以以对对分分类类变变量量描描述述其其频频数数取取值值的的比比例例,对对于于数数值值变变量量,则则像像直直方方图图那那样样应应先先计计算算各各区间取值的频数,再按比例画出。区间取值的频数,再按比例画出。图图2-27中中给给出出的的是是家家庭庭支支出出分分组组频频数数的的饼饼图图。要要注注意意的是

40、,如果有太多的分组,那么饼图就不那么好看了。的是,如果有太多的分组,那么饼图就不那么好看了。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.马赛克图马赛克图 马马赛赛克克图图(Mosaic Plot)一一般般不不对对单单个个变变量量作作,而而是是对对两两个个分分类类变变量量来来作作。这这种种图图的的好好处处是是直直观观显显示示了了两两个个变变量每种取值组合的观测个数和比例,如图量每种取值组合的观测个数和比例,如图2-28所示。所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.4 2.4 用用SASSAS绘制统计图

41、形绘制统计图形n2.4.1 用用INSIGHT绘制统计图形绘制统计图形n2.4.2 用用“分析家分析家”绘制统计图形绘制统计图形n2.4.3 编程绘制统计图编程绘制统计图n2.4.4 图形的调整与输出图形的调整与输出STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.4.1 用用INSIGHT绘制统计图形绘制统计图形 INSIGHT模模块块可可以以画画出出多多种种统统计计图图形形,而而且且图图形形清清晰晰、美观。美观。1.1.绘制直方图绘制直方图 选选择择菜菜单单“Analyze(分分析析)”“Histogram/Bar Chart(Y)(直直方方图图/条条形形

42、图图)”,打打开开“Histogram/Bar Chart(Y)”对对话话框框。在在数数据据集集的的变变量量列列表表中中,选选择择变变量量,然后单击然后单击“Y”按钮。按钮。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中选选择择“Labels(标标签签)”选选项项,如如图图所所示示,以以便便输输出出的的图图形显示中文标签名。单击形显示中文标签名。单击“OK”按钮返回对话框。按钮返回对话框。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单击单击“O

43、K”按钮,即可得到直方图如图按钮,即可得到直方图如图2-30左所示。左所示。单单击击图图形形框框左左下下角角处处的的三三角角形形,在在打打开开的的菜菜单单中中选选择择“Values(值值)”,即即可可在在图图中中显显示示频频数数值值,如如图图2-30右所示。右所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.绘制条形图绘制条形图 INSIGHT模模块块对对分分类类变变量量绘绘制制条条形形图图。首首先先单单击击R_Id变变量量名名上上边边的的变变量量作作用用按按钮钮,在在弹弹出出的的菜菜单单中中选选择择“Nominal(列名型)(列名型)”,如图左所示

44、。,如图左所示。选选择择菜菜单单“Analyze”“Histogram/Bar Chart(Y)”,打打开开“Histogram/Bar Chart(Y)”对对话话框框。在在数数据据集集的的变变量量列列表表中中选选择择变变量量,然然后后单单击击“Y”按按钮钮,如如图图右右所示。所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中选选择择“Labels(标标签签)”选选项项,单单击击“OK”按按钮钮返返回回对对话话框。框。单单击击“OK”按按钮钮,即即可可得得到到条条形形图图如如图图

45、2-34左左所所示示。如如果果选选择择Income_freq(见见2.2.2节节)作作为为分分析析变变量量,则则可以得到图可以得到图2-34右所示的条形图。右所示的条形图。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.绘制盒形图绘制盒形图 选选择择菜菜单单“Analyze”“Box Plot/Mosaic Plot(Y)”,可可以以对对区区间间型型变变量量作作盒盒形形图图,对对分分类类型型变变量量作作马马赛赛克克图图。打打开开“Box Plot/Mosaic Plot(Y)”对对话话框框。在在数数据据表表sryzc的的变变量量列列表表中中,选选择择in

46、come变变量量,然然后后单单击击“Y”按钮,按钮,income变量被选定,如图左所示。变量被选定,如图左所示。单单 击击“Output”按按 钮钮,在在 打打 开开 的的 对对 话话 框框 中中 选选 择择“Labels”选项,取消选项,取消“Y Axis Vertical”如图右所示。如图右所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单击单击“OK”按钮,即可得到盒形图如图按钮,即可得到盒形图如图2-36左所示。左所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程在在“Box Plot/Mosaic Plot(

47、Y)”对对话话框框中中选选定定多多个个分分析析变变量量,可可以以将将多多个个盒盒形形图图画画在在一一个个坐坐标标系系下下,这这样样便便于于比比较变量的取值情况,如图所示。较变量的取值情况,如图所示。图图形形分分析析:从从图图中中可可以以看看到到支支出出数数据据在在均均值值两两边边的的分分布布近近似似对对称称,说说明明低低于于和和高高于于平平均均支支出出的的家家庭庭几几乎乎各各占占一一半半;收收入入数数据据的的二二分分之之一一分分位位数数在在均均值值的的左左边边,说说明明大大部部分分人人的的收收入入低低于于平平均均收收入入。另另外外,10号号家家庭庭的的收收入入是一个极端值,它不具有代表性。是一

48、个极端值,它不具有代表性。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.绘制马赛克图绘制马赛克图 选选择择“Analyze(分分析析)”“Box Plot/Mosaic Plot(Y)(盒盒形形图图/马马赛赛克克图图)”命命令令,可可以以对对分分类类变变量量作作马马赛赛克克图图。下下面面以以2.2.2中中修修改改过过的的数数据据集集sryzc为为例例,作作出出R_Id变量和变量和Income_freq变量的马赛克图。变量的马赛克图。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.绘制马赛克图绘制马赛克图首先将首先

49、将R_Id变量改为变量改为“列名型列名型”(参见图(参见图2-33左)。左)。选选择择菜菜单单“Analyze(分分析析)”“Box Plot/Mosaic Plot(Y)(盒盒 形形 图图/马马 赛赛 克克 图图)”,打打 开开“Box Plot/Mosaic Plot(Y)”对对话话框框。在在数数据据集集sryzc的的变变量量列列表表中中,选选择择R_Id变变量量,然然后后单单击击“Y”按按钮钮,R_Id变变量量被选定,单击被选定,单击“OK”按钮,得到结果如图按钮,得到结果如图2-38所示。所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5.5.绘制

50、散点图绘制散点图 选选择择菜菜单单“Analyze”“Scatter Plot(Y X)”,打打开开“Scatter Plot(Y X)”对对话话框框。在在变变量量列列表表中中,选选择择Income,单单击击“Y”按按钮钮,Income变变量量被被选选定定为为Y轴轴变变量量,选选择择Outgo,单单击击“X”按按钮钮,Outgo变变量量被被选选定定为为X轴变量,如图左所示。轴变量,如图左所示。单单击击“OK”按按钮钮,即即可可得得到到散散点点图图如如图图右右所所示示。可可以以看出收入与支出有一定的线性相关关系。看出收入与支出有一定的线性相关关系。STATSTATSTATSTATSASSAS软件

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁