ch统计图形实用.pptx

上传人:莉*** 文档编号:73648006 上传时间:2023-02-21 格式:PPTX 页数:70 大小:861.79KB
返回 下载 相关 举报
ch统计图形实用.pptx_第1页
第1页 / 共70页
ch统计图形实用.pptx_第2页
第2页 / 共70页
点击查看更多>>
资源描述

《ch统计图形实用.pptx》由会员分享,可在线阅读,更多相关《ch统计图形实用.pptx(70页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2.3.1 定量变量的图形表示1.1.直方图直方图 对于数值型变量,常用直方图(histogram)来展示变量取值的分布。将变量取值的范围分成若干区间,在等间隔区间的情况下,每个区间的长度称为组距。考察数据落入每一区间的频数与频率,在每个区间上画一个矩形,它的宽度是组距,它的高度可以是频数、频率或密度(频率组距),在高度是密度的情况,每一矩形的面积恰是数据落入区间的频率,这种直方图可以估计总体的概率密度。第1页/共70页图2-22 密度直方图与频数直方图SAS软件会根据样本容量在样本取值范围内自动地确定一个分组方式,另外也提供了设定分组的方法。第2页/共70页2.2.盒形图盒形图 盒形图(bo

2、xplot,又称箱图、箱线图、盒子图),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,第3页/共70页2.2.盒形图盒形图图2-23的左边是根据居民家庭的收入情况所绘的盒形图;右边是分地区情况所绘的盒形图。第4页/共70页3.3.散点图散点图(Scatter Plot)。散点图用于表示一个变量随另一个变量变化的大致趋势。散点图将序列显示为一组点。值由点在图表中的位置表示。第5页/共70页3.3.散点图散点图比如家庭的收入和支出情况的数据,这里家庭总收入是一个变量,而家庭总支出是第二

3、个变量。希望通过图形了解收入和支出的关系,这时可以用一个变量为横坐标(如家庭总收入),另一个为纵坐标(这里是家庭总支出)来作图(图2-24)。这种图称为散点图(Scatter Plot)。第6页/共70页4.4.线图线图 线图(Line Plot)用来表示变量间的取值变化情况.适用于显示在相等时间间隔下数据的趋势。在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布。第7页/共70页4.4.线图线图 有单式和复式两种(图2-25)。在复式线图中可用不同颜色的实线来标志区别,如图2-25右所示。第8页/共70页2.3.2 分类变量的图形表示 分类变量也可以通过图形直观地描绘出它们各类

4、的数量和所占比例,常用的有条形图、饼图和马赛克图。1.1.条形图条形图 条形图(Bar Chart)给出分类变量取每个值的频数,如图2-26所示为变量R_ID取值的条形图。第9页/共70页2.2.饼图 通常,饼图(Pie Chart)可以对分类变量描述其频数取值的比例,对于数值变量,则像直方图那样应先计算各区间取值的频数,再按比例画出。图2-27中给出的是家庭支出分组频数的饼图。要注意的是,如果有太多的分组,那么饼图就不那么好看了。第10页/共70页3.3.马赛克图马赛克图 马赛克图(Mosaic Plot)一般不对单个变量做,而是对两个分类变量来做。这种图的好处是直观显示了两个变量每种取值组

5、合的观测个数和比例,如图2-28所示。第11页/共70页2.4.3 编程绘制统计图 SAS可以把存贮在SAS数据集中的数据以图形的方式形象直观地显示出来。在SAS/GRAPH模块的支持下,SAS可以作散点图、曲线图、直方图、扇形图、三维曲面图、等高线图、地图,等等。第12页/共70页1.GCHART1.GCHART过程过程(1)语法格式 GCHART过程用于绘制直方图、饼形图(扇形图)、三维直方图等表示变量分布的图形。其语法格式为:PROC GCHART DATA=;/AXISn 定义坐标;RUN;图形关键字绘制的图形类型图形关键字绘制的图形类型block方块图pie饼形图hbar水平的条形图

6、pie3d三维饼形图hbar3d水平的三维条形图donut环形图vbar竖立的条形图star星形图vbar3d竖立的三维条形图第13页/共70页(2)画条形图(直方图)使用VBAR关键字可以画条形图。例如,画出数据集Mylib.sryzc中Income变量的条形图的代码如下:proc gchart data=mylib.sryzc;vbar Income;run;结果如图所示。第14页/共70页(2)画条形图(直方图)使用HBAR关键字可以画条形图。例如,画出数据集Mylib.sryzc中Income变量的条形图的代码如下:proc gchart data=mylib.sryzc;Hbar I

7、ncome;run;结果如图所示。第15页/共70页 可以指定分组的变量,例如在每个区段内再分段,可以用如下代码:proc gchart data=mylib.sryzc;vbar Income/subgroup=R_Id;run;结果如图所示。思考:subgroup和group的区别?第16页/共70页 可以指定分组的变量,例如在每个区段内再分段,可以用如下代码:proc gchart data=mylib.sryzc;vbar Income/group=R_Id;run;结果如图所示。第17页/共70页(3)画三维条形图 使用BLOCK关键字可以画三维条形图。例如,画出数据集mylib.s

8、ryzc中Income变量的三维条形图的代码如下:proc gchart data=mylib.sryzc;block Income/group=R_Id;run;结果如图所示。第18页/共70页(4)画饼形图 使用PIE关键字可以画饼形图,PIE3D关键字可以画三维饼形图。例如,画出数据集mylib.sryzc中Income变量的三维饼形图的代码如下:proc gchart data=mylib.sryzc;PIE3D Income;run;结果如图所示。第19页/共70页(4)画饼形图 使用donut关键字可以画环形图,例如,画出数据集mylib.sryzc中地区(areaID)变量的环形

9、图的代码如下:proc gchart data=mylib.income;donut Income/subgroup=areaID;run;结果如图所示。第20页/共70页图形关键字后的变量名用以指定进行图形描述时的分组变量,可以是数值型的(此时以各组的组中值为分组的标志),也可以是字符型的。选项比较重要的有:SUBGROUP=变量名(分组变量),指定要进行分组(各组段内再分组)的变量;TYPE=统计量关键字,表示对变量(SUMVAR所指定的变量)的哪一种统计量进行绘图,比如频数(FREQ)、均数(MEAN)、总计(SUM)、频数百分比(PCTN)等;SUMVAR=变量名(数值变量),指定要进

10、行统计计算的变量,也就是“TYPE=统计量关键字”选项中统计量的计算所依据的变量。第21页/共70页proc gchart data=mylib.income;vbar areaid/sumvar=income type=mean;run;第22页/共70页2.2.使用使用GPLOTGPLOT过程绘制散点图和连线图过程绘制散点图和连线图 通常用散点图和连线图可以表示:一个变量随另一个变量的变化;变量之间的关系;数据值的分布。(1)GPLOT过程的一般格式PROC GPLOT DATA=;PLOT *=/;SYMBOLn;RUN;常用的选项见表2-6。第24页/共70页表2-6 PLOT语句的选

11、项选项意义说明FRAM|NOFRAM在图形四周加入或不加入边框缺省为加入CFRAM=颜色边框内的颜色缺省为白色AUTOHREF(AUTOVEREF)在水平(垂直)轴的每个主刻度处加入水平(垂直)参考线NOAXIS取消坐标轴及相关的图形元素CAXIS=颜色设定轴的颜色CTEXT=颜色设定与轴相关字符的颜色HAXIS=值列举设定水平轴主刻度的值VAXIS=值列举设定垂直轴主刻度的值overlay多个图共坐标第26页/共70页 SYMBOL语句用来控制表示点的符号和点间的连线。其中n是不同SYMBOL语句的序号,可以是1-99,缺省为1。选项见表2-7。表2-7 SYMBOL语句的选项选项意义取值V

12、=符号表示点使用的符号plus,x,star,square,diamond,triangle,hash,y,z,paw,point,dot,circleC=颜色表示点的符号及连线的颜色black,red,green,blue,cyan,magenta,gray,pink,orange,brown,yellowCV=颜色专指点的符号的颜色H=n指名符号的大小单位有:cell,cm,pct,pt,inPOINTLABEL在点的附近表明Y轴变量的值i=连线方式指明连线的方式none,join,spline,needleCI=颜色专指连线的颜色L=nn为线型的序号0 空白线,1-实线,2 虚线 W=n

13、n表示线的宽度第27页/共70页symbol语句是全局语句;恢复symbol的默认值:goptions reset=symbol;*关于图形的设置恢复到默认值;goptions reset=globol;*所有全局语句的设置恢复到默认值;第28页/共70页(2)散点图 绘制家庭总收入对家庭总支出的散点图,代码如下:proc gplot data=mylib.sryzc;plot Income*outgo;run;结果显示了一个GRAPHICS窗口,绘出了以Income为纵轴、以Outgo为横轴的散点图(见图)。第29页/共70页 可以在图中按第三个变量分组画出散点图(如图2-48右),代码如下

14、:proc gplot data=mylib.sryzc;plot Income*outgo=r_id;symbol1 color=black v=star;symbol2 color=blue v=dot;run;第30页/共70页(3)连线图 为了绘制连线,只要在SYMBOL语句中指定i=join。例如绘制家庭总收入对家庭编号的连线图(图2-49左),代码如下:proc gplot data=mylib.sryzc;plot Income*id;symbol i=join v=star;run;第31页/共70页 也可以分地区绘制家庭总收入对家庭编号的连线图(图2-49右),代码如下:pr

15、oc gplot data=mylib.sryzc;plot Income*id=r_id;symbol1 color=black i=join v=star;symbol2 color=blue i=join v=dot;run;第32页/共70页10名男青年身高(cm)与前臂长(cm)如下,请绘出散点图。Libname a c:user;data a.wt5_2;input x y ;cards;170 45 173 42 160 44 155 41 173 41 188 50 178 47 183 46 180 49 165 43;;;*绘出散点图,用于绘图的变量为x,y,坐标轴文本颜色

16、为蓝色;*定义散点标记为红色星号,大小为2run;第33页/共70页 为了考察改革开放以来我国的产业结构状况,这里收集了1987-2006年三大产业的GDP数据以进行分析。(gdp123)第34页/共70页symbol i=join;axis1 label=(year)order=(1987 to 2006 by 1);axis2 label=(gdp of each industry);axis3 label=(gdp of priamry industry);proc gplot;plot gdp1*year /haxis=axis1 vaxis=axis3;run;plot gdp1*y

17、ear gdp2*year gdp3*year/overlay haxis=axis1 vaxis=axis2;第35页/共70页symbol i=join;axis1 label=(year)order=(1987 to 2006 by 2);axis2 label=(gdp of each industry);proc gplot;plot gdp1*year gdp2*year gdp3*year/overlay haxis=axis1 vaxis=axis2;run;第36页/共70页 想在sas中画一个线图,横轴为时间,纵轴有两组数据,数量级不一样,一组是1000以上的数据,另外一组

18、是100左右的数据。我想看看这两组数据随时间的变化情况,在一个坐标系画出他们的线图,左边刻度表示1000以上数据,右边表示100左右的数据,应该怎么画图呀?第37页/共70页语句格式:proc GPLOT DATA=;SYMBOL1;SYMBOL2;plot*=1/;plot2*=2/;RUN;第38页/共70页DATA comp;INPUT day dhe meth;CARDS;1 18 127 2 16 130 3 15 116 4 17 1285 16 144 6 14 123.75 7 14 130 8 12 153.819 8 181 10 9 150 11 7 160 12 5 1

19、70;run;proc GPLOT DATA=comp;SYMBOL1 C=red V=dot I=spline;SYMBOL2 C=blue V=square I=join;plot dhe*day=1;*/vaxis=1 to 20 by 2;plot2 meth*day=2;*/vaxis=100 to 200 by 10;RUN;第39页/共70页ghart主要针对分类数据或单变量计量数据的图形描述,可以绘制出的图形主要有条形图(包括横条和竖条)、圆图、环形图和星形图等。gPlot过程通常用于对两个以上数值型变量关系的描述,每一条观测上的两个变量值被用来作为直角坐标系中点的坐标来绘制图

20、形,如散点图(scatter p1ot)和气泡图(babble plot)等。第40页/共70页2.4.4 图形的调整与输出 在图形中也可以用TITLE语句和FOOTNOTE语句给图形加标题和脚注。还可以在图形的标题、标签中使用TrueType字型的汉字,例如:goptions ftext=宋体 htitle=4 cells htext=3 cells;proc gplot data=sasuser.class;title 试验SAS图形的汉字功能;symbol i=none v=square;plot weight*height;label weight=体重 height=身高;run;输

21、出结果见图。其中GOPTIONS中的FTEXT选项指定图形中文本的字体。第41页/共70页 为了把GRAPH绘制的图形保存为兼容的图形文件,只要在显示某一页图形输出时,选“File-Export”菜单,在出现的输入文件名的窗口选择适当的文件类型,如BMP、WMF、JPEG、PS,等等。要打印GRAPH生成的图形,只要选“File-Print”。这样用Windows的打印驱动程序与SAS/GRAPH的图形驱动配合来打印。另外,SAS/GRAPH模块还提供了许多种打印机的独立的驱动程序,可以不依赖于Windows的打印驱动,具体请参考有关资料或帮助。第42页/共70页练习1、已知一批统计数据,包括

22、学号、性别、年龄、计算机成绩、等级等项,建立一永久数据集CLASS8,绘制等级的条形图。数据如下:94-001 F 25 88 B 94-002 M 27 90 A94-003 M 24 80 B94-004 F 24 75 C94-005 F 23 85 B94-006 M 24 65 D94-007 M 22 70 C94-008 M 25 76 C94-009 F 22 60 D94-010 F 23 66 D94-011 F 22 78 C94-012 F 24 85 B94-013 M 23 89 B94-014 F 22 62 D 第43页/共70页练习:2、调用上题数据集CLAS

23、S8,按变量SEX分组,绘出每组各等级人数的条形图。第44页/共70页利用散点图绘制sin(x)曲线第45页/共70页利用散点图绘制sin(x)曲线data temp;input x;y=sin(x);cards;0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 33.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5.

24、0 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6 6.1 6.2 6.3;proc gplot;plot Y*x;run;第46页/共70页2.4 2.4 用SASSAS绘制统计图形2.4.1 用用INSIGHT绘制统计图形绘制统计图形2.4.2 用用“分析家分析家”绘制统计图形绘制统计图形2.4.3 编程绘制统计图编程绘制统计图2.4.4 图形的调整与输出图形的调整与输出第50页/共70页2.4.1 用INSIGHT绘制统计图形 INSIGHT模块可以画出多种统计图形,而且图形清晰、美观。1.1.绘制直方图绘制直方图 选择菜单“Analyze(分析)”“Hist

25、ogram/Bar Chart(Y)(直方图/条形图)”,打开“Histogram/Bar Chart(Y)”对话框。在数据集的变量列表中,选择变量,然后单击“Y”按钮。第51页/共70页 单击“Output(输出)”按钮,在打开的对话框中选择“Labels(标签)”选项,如图所示,以便输出的图形显示中文标签名。单击“OK”按钮返回对话框。第52页/共70页 单击“OK”按钮,即可得到直方图如图2-30左所示。单击图形框左下角处的三角形,在打开的菜单中选择“Values(值)”,即可在图中显示频数值,如图2-30右所示。第53页/共70页2.2.绘制条形图绘制条形图 INSIGHT模块对分类变

26、量绘制条形图。首先单击R_Id变量名上边的变量作用按钮,在弹出的菜单中选择“Nominal(列名型)”,如图左所示。选择菜单“Analyze”“Histogram/Bar Chart(Y)”,打开“Histogram/Bar Chart(Y)”对话框。在数据集的变量列表中选择变量,然后单击“Y”按钮,如图右所示。第54页/共70页 单击“Output(输出)”按钮,在打开的对话框中选择“Labels(标签)”选项,单击“OK”按钮返回对话框。单击“OK”按钮,即可得到条形图如图2-34左所示。如果选择Income_freq(见2.2.2节)作为分析变量,则可以得到图2-34右所示的条形图。第5

27、5页/共70页3.3.绘制盒形图绘制盒形图 选择菜单“Analyze”“Box Plot/Mosaic Plot(Y)”,可以对区间型变量作盒形图,对分类型变量作马赛克图。打开“Box Plot/Mosaic Plot(Y)”对话框。在数据表sryzc的变量列表中,选择income变量,然后单击“Y”按钮,income变量被选定,如图左所示。单击“Output”按钮,在打开的对话框中选择“Labels”选项,取消“Y Axis Vertical”如图右所示。第56页/共70页 单击“OK”按钮,即可得到盒形图如图2-36左所示。第57页/共70页在“Box Plot/Mosaic Plot(Y

28、)”对话框中选定多个分析变量,可以将多个盒形图画在一个坐标系下,这样便于比较变量的取值情况,如图所示。图形分析:从图中可以看到支出数据在均值两边的分布近似对称,说明低于和高于平均支出的家庭几乎各占一半;收入数据的二分之一分位数在均值的左边,说明大部分人的收入低于平均收入。另外,10号家庭的收入是一个极端值,它不具有代表性。第58页/共70页4.4.绘制马赛克图绘制马赛克图 选择“Analyze(分析)”“Box Plot/Mosaic Plot(Y)(盒形图/马赛克图)”命令,可以对分类变量作马赛克图。下面以2.2.2中修改过的数据集sryzc为例,作出R_Id变量和Income_freq变量

29、的马赛克图。第59页/共70页4.4.绘制马赛克图绘制马赛克图首先将R_Id变量改为“列名型”(参见图2-33左)。选择菜单“Analyze(分析)”“Box Plot/Mosaic Plot(Y)(盒形图/马赛克图)”,打开“Box Plot/Mosaic Plot(Y)”对话框。在数据集sryzc的变量列表中,选择R_Id变量,然后单击“Y”按钮,R_Id变量被选定,单击“OK”按钮,得到结果如图2-38所示。第60页/共70页5.5.绘制散点图绘制散点图 选择菜单“Analyze”“Scatter Plot(Y X)”,打开“Scatter Plot(Y X)”对话框。在变量列表中,选择

30、Income,单击“Y”按钮,Income变量被选定为Y轴变量,选择Outgo,单击“X”按钮,Outgo变量被选定为X轴变量,如图左所示。单击“OK”按钮,即可得到散点图如图右所示。可以看出收入与支出有一定的线性相关关系。第61页/共70页 在数据集窗口选中所有1号地区的观测号,图2-40是在散点图中区分两个地区的情况,细点为2号地区,粗点为1号地区。从该图可以看出1号地区比2号地区在收入和支出水平上都要高出许多。第62页/共70页6.6.绘制线图绘制线图 选择菜单“Analyze(分析)”“Line Plot(Y X)(分布)”,打开“Line Plot(Y X)”对话框。在数据集sryz

31、c的变量列表中,选择ID变量,单击“X”按钮,ID变量被选定为X轴,然后选择Income变量,单击“Y”按钮,如图左所示。单击“OK”按钮,即可得到线图如图右所示。第63页/共70页 若在“Line Plot(Y X)”对话框中,将ID变量选定为X轴,选择Income变量和Outgo变量,单击“Y”按钮。单击“Output(输出)”按钮,在打开的对话框中选择“Labels(标签)”选项,如图左所示,以便输出的图形显示中文标签名。两次单击“OK”按钮,得到关于Income变量和Outgo变量的复式线图(图右)。第64页/共70页2.4.2 用“分析家”绘制统计图形1.1.绘制饼图绘制饼图 在“分

32、析家”中打开数据集mylib.sryzc。选择主菜单“Graphs”“Pie Chart”,打开“Pie Chart”对话框,选择变量列表中的Income,单击“Chart”按钮,选定分析变量,如图左所示。所得饼图如图右所示。第65页/共70页2.2.绘制条形图绘制条形图 选择主菜单“Graphs”“Bar Chart”“Horizontal”,打开“Horizontal Bar Chart”对话框,选择变量列表中的INCOME,单击“Chart”按钮,选定分析变量,选择R_ID变量,单击“Stack By”按钮,再选中3-D选项,如图左所示。单击“OK”按钮,得到水平条形图,如图右所示。第6

33、6页/共70页2.4.3 编程绘制统计图 SAS可以把存贮在SAS数据集中的数据以图形的方式形象直观地显示出来。在SAS/GRAPH模块的支持下,SAS可以作散点图、曲线图、直方图、扇形图、三维曲面图、等高线图、地图,等等。第67页/共70页例1.7.5 把条曲吓到同一座标系内。SAS程序HZQXT.PRGDATA comp;AXIS1 LABEL=(C=orange F=swiss A=90 SCORE);INPUT day dhe meth;AXIS2 LABEL=(C=cyan F=swiss DAYS AFTER TREATMENT);CARDS;FOOTNOTE C=yellow F

34、=swiss DOT-DHE SQUARE-METH;1 26.38 27.59 SYMBOL1 C=red V=dot I=spline;2 12.46 10.10 SYMBOL2 C=blue V=square I=spline;3 10.23 6.16 PROC GPLOT DATA=comp;4 7.92 5.78 PLOT(dhe meth)*day/VAXIS=AXIS15 5.68 4.14 VAXIS=0 TO 30 BY 56 4.83 3.75 VMINOR=1 HMINOR=07 4.29 2.98 HAXIS=AXIS28 2.57 3.81 OVERLAY;9 0.47 1.41 RUN;RUN;第68页/共70页程序绘制函数y=sin(x)的曲线图DATA SIN;DO X=-2*3.14 TO 2*3.14 BY 0.2;Y1=SIN(X);Y2=COS(X);OUTPUT;END;SYMBOL1 I=J V=PLUS;PROC GPLOT;PLOT Y1*X=1 Y2*X/OVERLAY;RUN;第69页/共70页感谢您的欣赏!第70页/共70页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁