统计学实验指导.pdf

上传人:g****s 文档编号:86093669 上传时间:2023-04-13 格式:PDF 页数:14 大小:944.10KB
返回 下载 相关 举报
统计学实验指导.pdf_第1页
第1页 / 共14页
统计学实验指导.pdf_第2页
第2页 / 共14页
点击查看更多>>
资源描述

《统计学实验指导.pdf》由会员分享,可在线阅读,更多相关《统计学实验指导.pdf(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、 1 第二章统计学实验指导 实验一:统计数据收集 实验目的:次级统计数据的搜集方法、搜集途径。实验要求:熟练掌握网络搜集数据,并进行基本预处理。实验形式:教师指导 实验内容:1、网站数据查询:网站查询、搜索引擎 2、数值预处理:数据在 excel中的录入与存储、数据排序与筛选。一、统计数据的收集 1、直接调查(略)练习 1:在网上搜索至少一篇统计调查方案,了解统计调查的基本流程。2、网站查询 直接登录常用数据发布的网站网址快速查询个人感兴趣的数据信息 如:国家统计局网,免费查询全国宏观数据、各类普查数据、专题数据、国际数据等 中国人口与发展研究中心,有关人口方面的统计公报、人口数据(注册购买)

2、等 中国经济信息网,查询宏观经济发展的各类专题报告,十余个专题数据库(购买)各级地方统计局,有独立统计局网站和政务合并网两种情况。3、搜索引擎 常用 google、百度搜索引擎,按照关键词检索复合条件的网站信息,用户自行查阅 练习 2:至少采用两种方法查询 2000年以来山东省有关人口数据。二、统计数据的存储与管理 1、数据编码与录入 一般品质数据编码处理,方便快速录入与数据后期加工。录入时,为避免人为错误,最好能保证至少两人各独立录入一次,核实错误。Excel中,一般同一变量的数据按列放置,首行为列标题(变量名)行,一行存储一个总体单位的调查数据。2、数据排序:数据排序是逻辑检查常用的一种方

3、法,本身也是分析方法。将鼠标定位于待处理数据区域的任意位置;点击菜单“数据”排序后,进入排序对话框;2 排序对话框中:主要关键字:排序变量。次要关键字:各总体单位排序变量取值相同时,若指定次要关键字,则按此排序,否则按出现的先后顺序排。我的数据区域:选择参与排序的数据区域。有标题行,则数据区域第一行不参与排序,一般数据区域首行为变量名时如此选择。否则,无标题行,数据从第一行第一列开始排序。选项:指定升降序排列形式:次序、方向、方法,用于字符型数据的排序设置。练习 3:对加工零件数按照一定大小进行排序;对售后服务质量按照一定优劣进行排序。3 实验二:统计整理与分组 实验目的:运用 excel进行

4、常见数据类型的统计整理,能熟练运用菜单和各类函数进行数据整理。熟练应用统计函数编制组距式分组统计次数分布数列。实验要求:独立完成课堂各类习题和练习,按要求完成实验内容。实验形式:教师演示、指导 实验内容:1、品质数据分组:利用数据透视表直接绘制,但是需要注意排序数据 2、数值数据分组:对数据排序后,能分析选择数值数据的分组形式。能利用数据透视表编制单项式分组统计次数数列;熟练应用统计函数编制组距式分组统计次数分布数列。统计整理及分析结果的编写通常在 word文档中录入和编辑,只要能用 excel生成相对规范的统计表和统计图,然后可以复制到word中进行美化排版即可。一、品质数据的简单分组 选择

5、菜单“数据”数据透视表和数据透视图,进入数据透视表操作向导对话框。第一步:按照向导默认即可,只生成数据透视表。第二步:选择源数据,返回 excel文件选择包含变量名在内的整个数据库区域。第三步:设计透视表的内容和格式。透视表的显示位置:通常与原始数据放置在一起,透视表会占用一部分空间,所以最好与源数据相隔一定距离。选择源数据文件工作表的空白区域,随意定位一个空白单元格即可。布局:设计数据透视表的显示模式。拖放分组变量在行标题栏,系统根据它的属性自动设置组数和类别。拖放同一分组变量到数据区域,系统会自动生成一次对应各组的数据,默认为计数,4 即汇总各组的频数。再次拖放仍然执行相同操作,只要双击按

6、钮,实验者可以根据需要进行修改,比如计算频率(双击后,进入修改界面,可以修改名称和汇总方式,点击“选项”拉开数据显示方式选择“占同列数据的百分比”即可)。其余操作按照默认即可。点击完成,分组表和普通统计表视觉上不大一致,选定已生产透视表的“数据”,右击后,选择“顺序移至列”即可。注意事项:(1)数据透视表是根据源数据生成,一旦源数据变化,则分组结果随时改变。排版过程中,最好是选择性粘贴(值)然后再排版则表中数值不再变动。(2)如果统计数据为讲究顺序的品质数据,系统一般不会自动排序。可以先让软件自行整理,然后将分组结果选择性粘贴,操作者自行修改组别排列方式。选择性粘贴的操作:当采用数据透视表生成

7、统计分组结果以后,这里面的一切输出结果都是嵌套了数据宏工具,原始数据发生变化,结果会随时变化,并且操作者不能单独对其中的某些数据进行编辑修改。为此,当需要对整理结果进行某些编辑时,通常只将结果复制出来,而不需要复制其内含的公式和格式等内容。鼠标点击“复制”按钮,然后定位要复制的目标位置后,在“粘贴”按钮右侧有一个下拉小箭头,点开以后选择“值”或者在菜单“编辑”里面点击“选择性粘贴”,在打开的对话框中选择“数值”。执行此项操作,表示只对原数据粘贴其结果,其他都不保留。练习 1:对工人分别根据户口类别和教育程度进行分组整理;对售后服务质量进行分组整理。二、数值数据的单项式分组 按分组标志采用数据透

8、视表,基本操作同前,只是要注意修改布局对话框中的默认数据显示方式“求和”改为“计数”。5 练习 2:编制学生年龄分组表 三、数值数据的组距式分组:组距式分组由于组数和组距、组限的设计主观性比较强,其格式需要研究人员自行编制,主要通过 excel函数来完成。具体操作顺序按照统计分组理论顺序进行。(1)组数设计:组数 Sturges经验公式:1+log(总体单位数,2)总体单位数 count(数据区域)(2)计算极差:最大值 max(数据区域)、最小值 min(数据区域)(3)等距组距设计:极差/组距,此计算结果通常不是整 5 或 10 的倍数,可人为认定。(4)分组结构设计:选择存放分组数据的一

9、个空白区域,设定第一组的结构,然后利用公式填充,注意绝对引用与相对引用的关系,合理利用数学逻辑可以快速提高分组效率。(5)汇总频数:频数函数 frequency(数据区域,临界值)。输入此公式前,必须提前设定临界值,临界值用于判定总体单位的组别归属,遵循不重不漏和上限不在内原则,通常设置为比原始数据精度更精确一些,同时比组上限稍小一些的数值。选定存放各组频数的所有组单元格后挪开鼠标,不要点击。因为首行是反显的,直接利用键盘输入 frequency函数即可。该函数是一次生成所有组的频数,数组函数确认方法:Ctrl+Shift+Enter,三个键同时摁下,表示函数输入完毕,返回运算结果。练习 3:

10、编制工人加工零件数等距分组表;根据教材练习 4,对灯泡的使用寿命以组距为 10 进行等距分组。6 实验三:统计图表的绘制 实验目的:运用 excel设计符合基本要求的统计表,会绘制反映数据特征的合适的统计图。实验要求:独立完成课堂各类习题和练习,按要求完成实验内容。实验形式:教师演示、指导 实验学时:3 学时 实验内容:熟练绘制统计表,能绘制出相对专业地道的统计表;根据数据反映特征,熟练选择绘制合适的统计图形,掌握条形图、直方图、饼图、折线图等图形的绘制方法。一、统计表的绘制及编辑:1、统计表的结构:一张完整的统计表一般包含总标题、行标题、列标题、数据主体。通常一个 excel工作簿会自动打开

11、 3 张工作表,默认名称为 sheet1-3,用户可以双击更改名称,可以拖动表的存放位置,也添加或删减工作表。在工作表名称状态栏处鼠标定位添加或删减工作表,然后右击,即可快捷完成。一般,统计表的信息如果不是系统自动生成,则用户自行设计录入。系统自动生成的,则根据统计表的理论要求进行编辑即可。如果统计整理得到的各类分组表,最好是将分组结果进行“复制选择性粘贴值”以后,再进行编辑比较方便。2、统计分组表的要求:左右开口,上下封口,顶线和底线加粗。统计表的各类边框及线的粗细利用菜单“格式单元格”操作,进入格式设置对话框,点击边框,有多种样式的边框格式可供选择。3、表格的页面及打印设置:如果统计数据特

12、别多,需要打印输出,一张纸无法容纳或者需要换页输出打印,这时就需要打印设置。通过菜单“文件”来执行。(1)页面设置:用于设定打印页面纸张、页边距、页眉页脚、工作表打印选项等。这种 7 设置一般在其他设置完成后,在打印预览对话框中再选择。(2)打印区域:鼠标选中需打印输出的数据区域,然后点击菜单“文件打印区域设置打印区域”即可。(3)打印预览。用于提前预览打印效果,防止打印效果不如人意或者错误,造成浪费。选择菜单“文件打印预览”或常用工具里的打印预览按钮,进入预览界面。1)设置:即页面设置,“页面”选项用于选择输出纸张大小及输出方向。页边距卡卡用于设计上下左右及页眉页脚的边距,表格在页面上是否居

13、中放置。页眉/页脚卡用于设计表格外的文本内容。如统计表的总标题我们一般放于页眉位置,表外附加说明和页码放置于页脚。比如:点击自定义页眉,进入页眉设计对话框,用户可以自行输入内容并选择合适的格式。工作表卡用于专门针对表格输出进行设计,比如打印网格线,多页打印时需要统一将输出表格的首行设计为统计表的首行内容或首列内容等等。2)页边距。选择此选项,页面会自动按照用户设计的页边距显示出一系列边界线,用户可以随意拖放任意修改,直到满意。应用 1:选择 A4 纸张打印员工档案资料,要求自定义页眉为员工档案信息”,自定义页脚为“第?页,共?页”,表格居纸张正中,并打印网格线。二、统计图的绘制:只要求大家就次

14、数分布绘制最常用的统计图,关于其他功能的图形,我们在具体讲课中用到再给同学们讲解,所有统计图的基本操作几乎一样。主要区别在于具体图形类型的 8 绘制细节上要结合数据特点来选择数据区域,即数据“系列”的选择,这些系列在于区分开分类轴和数值轴即可,关于图形的美观程度,需要根据视觉效果再不断调整优化。次数分布图都是基于次数分布表来绘制的,所以必须先分组,后作图。无论什么统计图,在利用 Excel制作时,所有的图形都是在菜单“插入图表”选项下选择使用。进入图表制作向导对话框。1、利用图表向导绘制图形 图表制作向导共分四个步骤,用于引导用户生成图形。第一步,选择图的类型。分为标准类型和自定义类型,常用的

15、在标准类型中,自定义类型多是两个图形的组合。第二步,选择源数据。即指明图形是基于哪些数据生成。如果用于制作图形的数据相邻存放,可以直接在“数据区域”中选入;如果不相邻存放,则需要用“系列”来个性化自定义。系列:选择添加后,可以给系列命名,指定系列的值,生成图形后放于数值轴,一般是频数或频率。指定系列的分类轴,对应于组别。第三步,图表选项。用户格式化一些图形结果需要显示的内容,比如横纵坐标的标题、表图同时显示、图例、绘图区的细节问题。9 第四步,图的存放位置。为了保证图表一致,通常是作为对象插入。提醒:(1)在根据向导完成图表的初步绘制后,用户仍然可以对它修改编辑。(2)图表区:Excel中用来

16、存放图表的矩形区域,它包含绘图区和一切与图形有关的数据、标题、图例等标示。Excel允许用户修改整个图表区中的文字、填充以及对象属性,我们通常修改“图表区格式”和“图表选项”。A、选定图表区右击,选择“图表区格式”,进入格式修改对话框,有“图案”(用于设定图表边框样式及颜色、区域的填充颜色)、“字体”(用于设置图表中字体和字号,类似于单元格格式里的内容设置)、“属性”(用于设计图表的显示位置,一般不做修改)等三个选项卡。B、选定图表区右击,选择“图表选项”,进入图表选项设置修改对话框。其基本操作等同于操作向导的第三步。一般用户在生成图形后,美化编辑过程中可以根据需要在此重新修改图表选项。(3)

17、绘图区:Excel中由纵横坐标轴所框定的矩形区域,专门用于存放图形的区域。饼图的绘图区为饼的外切正方形(体)。当用户鼠标选定绘图区后,右击,选择“绘图区格式”,可以对图形“图案”进行修改,类似于“图表区格式”中的“图案”选项卡。2、常见几种统计分组图形的绘制(1)饼图(pie chart):制作饼图后,通常数据系列不需要显示,在第三步向导中选择图例不显示,数据系列中选中类别、百分比直接标示于扇形上即可。饼图对应的圆在整个图表区中较小时,点整个饼的外切正方形对应的角部区域即可拖放实现图的大小缩放。10 应用 2:绘制售后服务质量饼图 绘制员工受教育程度饼图 提示:根据频数和频率绘制的图形完全一样

18、,只是图中的具体数据有差别。(2)条形图(Bar chart):做完条形图后,鼠标点击矩形条后右击,选中“数据系列格式”,可以对各个矩形条进行编辑修改,诸如填充颜色,添加数值,分类间距等。应用 3:根据员工加工零件的单项式分组结果绘制条形图 提示:条形图既可以根据频数,也可以根据频率来绘制。(3)直方图(histogram):为简化起见,在条形图的基础上,修改“数据系列格式”,定义“选项”选项卡,将数据的分类间隔设为“0”即可。通常,Excel中该图形只适用于等距分组的图形展示。应用 4:绘制加工零件直方图 提示:直方图通常只根据频率来绘制。(4)折线图(polygon):Excel制作折线图

19、前,首先在原始统计分组表两端人为添加两个频率为“0”的空白组。在图标插入向导中,选择“自定义类型”中,然后选择“线-柱图”,分别设置两个同样的数据系列对应于折线图和条形图,然后将条形图间隔设为 0。应用 5:绘制加工零件折线图 提示:折线图通常只根据频率来绘制。且定义 2 个数据系列时,分类轴为同样的数据区域(第一组和最后一组没有信息,中间各组为真实组数),数值轴为同样的数据区域(包含第一组频率=0 和最后一组频率=0 以及中间真实的各组频率在内)。(5)次数分布曲线:在图表插入向导中,选择图形的“自定义类型”,然后选择“平滑直线图”,剩余操作根据向导提示与其他图形类似。应用 6:分别根据加工

20、零件的单项式和组距式分组结果绘制次数分布曲线,并比较差异。提示:从分布曲线形状、分布特征的体现角度去考察 3、绘制统计图时的注意事项(1)通过选择恰当的图形类型、刻度、长宽比例等,使图形能够准确反映数据中包含的信息。时间一般绘在横轴,指标数据绘在纵轴。长宽比例要适当,其长宽比例大致为 11 10:7。(2)图形要尽量简明。图形应该突出所要传达的信息,不必要的标签、背景、网格线等会分散读者的注意力。(3)图形应该有清楚的标题和必要的说明,明确图形的含义、计量单位、坐标轴代表的变量、资料来源等等。(4)反复加工和修改是获得优秀统计图形的重要步骤。统计软件给出的统计图形没有多少可以不加修改而直接应用

21、。12 实验四:描述统计 实验目的:利用 Excel统计函数和一些基本的数学运算函数、公式进行描述统计指标的计算。利用 Excel安装“数据分析”工具库,并输出各描述指标值,分析数据的分布特征。实验要求:熟练掌握各种描述统计指标的对应函数,计算诸如众数、中位数、四分位数、算术平均数、调和平均数、几何平均数、极差、方差、标准差等的相关操作。运用“数据分析”工具库计算的统计指标,分析数据的基本分布特征。实验形式:教师演示、指导 实验学时:3 学时 实验内容:在计算各类描述指标过程中,我们会用到常用的数学或统计函数,以及根据运算逻辑关系自行定义输入公式。函数格式:=函数名(参数 1,参数 2,)输入

22、各类函数的参数时,一般可以鼠标拖动选择,或者手动输入数据区域。手动输入时,用数据范围的矩形对角线所对应的单元格定义即可,中间用“:”链接,表示“到”。如:对单元格 a1 到 b3 所围成的矩形区域中的数据求和,直接输入:=sum(a1:b3),回车确认即可返回合计值。一、集中趋势指标的计算:计算集中趋势的函数名称有众数 mode、中位数 median、四分位数 quartile、算术平均数 average、调和平均数 harmean、几何平均数 geomean等几个,但在具体计算过程中,需要根据数据是否经过整理分组选择合适的算法。如果数据未经过任何整理,可以直接通过函数计算结果。如果是分组数据

23、,则需要按照理论分析一步步的运用公式进行计算。1、众数(1)未整理数据:mode(number1,number2,),将待计算的数据区域作为参数,就可以得到指定数据的众数。(2)分组整理数据:判断众数组,根据分组类型,直接确定或采用近似公式计算。2、中位数(1)未整理数据:median(number1,number2,),将待计算的数据区域作为参数,就可以得到指定数据的中位数。(2)分组整理数据:先利用累积频数判断中位数所在组,然后根据分组类型,直接判断或采用近似公式计算。计算向上累积频数,由于每组的累积频数结果都是从第一组开始累积,因此,利用求和函数 sum时,把起始单元格必须设置成绝对引用

24、格式,即用“$”将行、列给固定。3、四分位数(1)未整理数据:quartile(array,quart),将待计算的数据区域作为一个数组,指定分位数的位次quart。若 quart=0,则输出最小值;quart=1,输出下四分位数;quart=2,输出中位数;quart=3,输出上四分位数;quart=4,输出最大值。(2)分组整理数据:先利用累积频数判断四位数所在组,然后根据分组类型,直接判断或采用近似公式计算,过程等同于中位数。4、均值(1)算术平均数 1)未整理数据:average(number1,number2,),将待计算的数据区域作为参数,13 就可以得到指定数据的算术平均数。2)

25、分组整理数据:使用加权算术平均。利用乘积求和函数 sumproduct(array1,array2,)计算总体标志值总量。将各组变量值设置为 array1,各组对应的频数设置为 array2,可以计算两个数组的对应数据的乘积和,对应于加权算术平均数的分子部分xf。然后利用除法公式计算平均数。注意:单项式分组中,x为各组变量值;组距式分组中,x 为各组组中值,需要事先添加计算出组中值。(2)调和平均数 1)未整理数据:harmean(number1,number2,),将待计算的数据区域作为参数,就可以得到指定数据的调和平均数。2)分组整理数据:使用加权调和平均。利用乘积求和函数 sumprod

26、uct(array1,array2,),将各组变量值(同样对于组距式分组必须先计算组中值)的倒数设置为 array1,各组对应的频数设置为 array2,可以计算两个数组的对应数据的乘积和,对应于加权调和平均数的分母部分mx。然后利用除法公式计算平均数。(3)几何平均数 1)未整理数据:geomean(number1,number2,),将待计算的数据区域作为参数,就可以得到指定数据的几何平均数。2)分组整理数据:使用加权几何平均。利用幂函数 power(number,power),以每组的变量值为底,频数为幂指数,分组别计算出各组的变量值总量(同样对于组距式分组必须先计算组中值),对应于每组

27、的ifix。然后利用乘积函数 product(number1,number2,),将前一步的幂函数运算结果选入作为参数,计算总体总量。然后再利用 power()函数,以总频数的倒数为幂指数,计算得到几何平均数。二、离散程度指标的计算 计算离散程度的函数名称有总体方差 varp、总体标准差 stdevp、样本方差 var、样本标准差 stdev。如果数据未经过任何整理,可以直接通过函数计算结果。如果是分组数据,则需要按照理论分析一步步的运用公式进行计算。1、极差 1)未分组数据:利用 max(number1,number2,)、min(number1,number2,),以数据区域作为参数,分别

28、求出数据的最大值和最小值,然后做差计算得到。2)分组数据:理论上用最大值组的上限-最小值组的下限,但实际上计算没有意义 2、四分位距,利用定义上下四分位数做差即可。3、方差或标准差(1)未分组数据:判断数据是总体数据还是样本数据。1)总体数据。总体方差:varp(number1,number2,),将总体数据区域作为参数。总体标准差:stdevp(number1,number2,),将总体数据区域作为参数,得到总体标准差。或者将总体方差计算得到,然后用平方根函数sqrt(number),对总体方差开平方得到总体标准差。14 2)样本数据。样本方差:var(number1,number2,),将

29、样本数据区域作为参数,得到样本方差。样本标准差:stdev(number1,number2,),将样本数据区域作为参数,得到样本标准差。或者将样本方差计算得到,然后用平方根函数 sqrt(number),对样本方差开平方得到样本标准差。(2)分组数据:判断数据是总体数据还是样本数据,结合方差的计算公式,类似于加权算术平均数的计算过程。方差得到,然后利用平方根函数求得标准差。4、标准差系数。直接用公式计算:标准差除以算术平均数 三、统计描述指标的统一展示:查看工具菜单下是否有“数据分析”子菜单。一般,office软件选择典型安装时,都没有安装。若没有,在此菜单下点击“加载宏”,然后加载“分析工具

30、库”,加载成功之后就可以找到数据分析子菜单了,然后 Excel就配有了专门用于统计分析的宏。首先将所有原始数据排放在同一列(行),然后调用“工具数据分析描述统计”,根据需要选用输出项目,常用的描述指标均有,其输出结果与我们前面采用函数计算的结果一致。“数据分析”工具只适用于数值型数据。输出内容的说明:利用描述统计功能,把数据当做样本来处理。“平均”即均值,“标准误差”即样本均值的抽样标准差(s/sqrt(n)),“标准偏差”即样本标准差,“区域”即极差。如果需要计算总体方差或标准差,需要根据样本标准差调整一下容量系数即可。四、使用科学计算器进行统计指标计算 由于学生手中计算器类型不同,无法统一

31、设定操作说明。以Kenko为例。1、依次按 Mode、2,即可进入 SD 状态,然后可以进行统计计算。2、在输入数据前务必先按 shift、Scl(Stat Clear)、=这三个键以清空统计存储器中的数值。具体操作因计算器有些微差别。3、在标准差 SD 和回归 REG统计功能下,M+键起 DT 键的作用,即输入并存储数据。4、输入数据的过程:(x 的数据)、DT 5、输入的数据用以计算n、x、2x、x、n(总体标准差)、1n(样本标准差)等各数值。执行的按键操作 计算的数值 RCL、字母 A(对应于“(-)”键)2x RCL、字母 B(对应于“。,”键)x RCL、字母 C(对应于 hyp 键)n Shift、x(对应于数字 1)、=x Shift、nx(对应于数字 2)、=n Shift、1nx(对应于数字 3)、=1n

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 文案大全

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁