《Excel在统计中的应用与数据统计分析教案资料.doc》由会员分享,可在线阅读,更多相关《Excel在统计中的应用与数据统计分析教案资料.doc(72页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Good is good, but better carries it.精益求精,善益求善。Excel在统计中的应用与数据统计分析-Excel在统计中的应用Excel与数据统计分析一、实验说明(一)中文Excel简介MicrosoftExcel是美国微软公司开发的Windows环境下的电子表格系统,它是目前应用最为广泛的办公室表格处理软件之一。自Excel诞生以来Excel历经了Excel5.0、Excel95、Excel97和Excel2000等不同版本。随着版本的不断提高,Excel软件的强大的数据处理功能和操作的简易性逐渐走入了一个新的境界,整个系统的智能化程度也不断提高,它甚至可以在某
2、些方面判断用户的下一步操作,使用户操作大为简化。Excel具有强有力的数据库管理功能、丰富的宏命令和函数、强有力的决策支持工具、图表绘制功能、宏语言功能、样式功能、对象连接和嵌入功能、连接和合并功能,并且操作简捷,这些特性,已使Excel成为现代办公软件重要的组成部分。由于大家对Excel的常用办公功能都比较熟悉,本实验重点介绍Excel在统计分析中的应用。(二)实验目的与要求本实验重点介绍Excel在统计分析中的应用,包括Excel在描述统计中的应用以及Excel在推断统计中的应用,要求学生熟练掌握运用Excel进行统计分析的方法,并能够对分析结果进行解释。二、实验实验一Excel在描述统计
3、中的应用实验目的及要求要求学生掌握运用Excel进行描述统计分析、绘制各种图表和运用数据透视表工具的技术。实验内容及步骤(一)描述统计分析例1-1:表1-1是1978-2005年我国城镇居民可支配收入数据,试求城镇居民可支配收入时间序列的基本统计量。表1-11978-2005年我国城镇居民可支配收入(元)年份城镇居民可支配收入年份城镇居民可支配收入197834419922026.6197940519932577.41980477.619943496.21981500.4199542831982535.319964838.91983564.619975160.31984652.119985425
4、.11985739.119995854-1986899.62000628019871002.220016859.619881181.420027702.81989137920038472.219901510.220049421.619911700.6200510493STEP1:用鼠标点击工作表中待分析数据的任一单元格。STEP2:选择“工具”菜单的“数据分析”子菜单。STEP3:用鼠标双击数据分析工具中的“描述统计”选项。STEP4:出现“描述统计”对话框,如图1-1所示。图1-1对话框内各选项的含义如下:输入区域:在此输入待分析数据区域的单元格范围。分组方式:如果需要指出输入区域中的数据是
5、按行还是按列排列,则单击“行”或“列”。标志位于第一行/列:如果输入区域的第一行中包含标志项(变量名),则选中“标志位于第一行”复选框;如果输入区域的第一列中包含标志项,则选中“标志位于第一列”。复选框:如果输入区域没有标志项,则不选任何复选框,Excel将在输出表中生成适宜的数据标志。均值置信度:若需要输出由样本均值推断总体均值的置信区间,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。例如,置信度95%可计算出的总体样本均值置信区间为10,则表示:在5%的显著水平下总体均值的置信区间为(X-10,X+10)。第K个最大/小值:如果需要在输出表的某一行中包含每个区域的数据的第k个
6、最大/小值,则选中此复选框。然后在右侧的编辑框中,输入k的数值。输出区域:在此框中可填写输出结果表左上角单元格地址,用于控制输出结果的存放位置。新工作表:单击此选项,可在当前工作簿中插入新工作表,并由新工作表的A1单元格开始存放计算结果。如果需要给新工作表命名,则在右侧编辑框中键入名称。新工作簿:单击此选项,可创建一新工作簿,并在新工作簿的新工作表中存放计算结果。汇总统计:指定输出表中生成下列统计结果,则选中此复选框。STEP5:填写完“描述统计”对话框之后,按“确定”按扭即可。结果如图1-2所示。图1-2描述统计结果结果说明:描述统计工具可生成以下统计指标,按从上到下的顺序其中包括样本的平均
7、值、标准误差、组中值、众数、样本标准差、样本方差、峰度值、偏度值、极差、最小值、最大值、样本总和、样本个数和一定显著水平下总体均值的置信区间。(二)绘图操作例1-2:仍以例1-1的数据为例,绘制城镇居民可支配收入时间序列的散点图。STEP1:拖动鼠标选定数值区域A2:C12,不包括数据上面的标志项。STEP2:选择“插入”菜单的“图表”子菜单,进入图表向导,图1-3所示。STEP3:选择“图表类型”为“散点图”,然后单击“下一步”。图1-3图表向导图STEP4:确定用于制作图表的数据区。Excel将自动把你前面所选定的数据区的地址放入图表数据区的内,单击下一步按钮,出现图1-4所示对话框。图1
8、-4作图过程图STEP5:填写图表标题、X轴坐标名称、Y轴坐标名称,此处不用填写,单击“下一步”。STEP6:选择图表输出的位置,然后单击“完成”按扭即生成(三)数据透视表工具数据透视表是Excel中强有力的数据列表分析工具。它不仅可以用来作单变量数据的次数分布或总和分析,还可以用来作双变量数据的交叉频数分析、总和分析和其它统计量的分析。例1-3:表1-2列出了学生两门功课评定结果,建立学生两门功课评定结果的交叉频数表。表1-2学生两门功课评定结果学号语文数学学号语文数学1001优差1006中良1002良中1007中优1003中中1008差良1004差中1009良中1005差差操作步骤:STE
9、P1:输入数据,选中有数据的任一单元格,然后选择“数据”菜单的“数据透视表”子菜单,进入数据透视表向导。STEP2:选择“MicrosoftExcel数据清单或数据库”为数据源。图1-6所示,单击“下一步”。图1-6STEP3:选择待分析的数据的区域,一般情况下Excel会自动根据当前单元格确定待分析数据区域,因此你只要直接单击“下一步”按扭即可。STEP4:确定数据透视表的结构,在此例中,要建立的是一个交叉频数表,分别按语文和数学的成绩对学生的人数进行交叉频数分析,因此可将三个按扭“学号”、“语文”、“数学”分别拖放到表格的指定部位,并且双击“求和项:学号”,将其改为记数项,结果如图1-7所
10、示。图1-7布局对话框STEP5:选择数据透视表的显示位置之后,单击“完成按扭”,可出现如图1-8所示的数据透视表。图1-8结果说明:如图1-8的结果所示,数据透视表可以作为一个交叉频数分析工具。完成数据透视表之后,可按需要修改数据表的显示格式。例如,如果想要把表格中的频数替换成为百分比数。可以用鼠标右击频数的任一单元格,选择“字段”子菜单,单击“选项”按扭,将“数据显示方式”替换成为“占总和的百分比”,然后单击“确定”按扭即可。按同样方式,可将数据透视表修改成为其它不同样式。实验二Excel中的二项分布工具实验目的及要求掌握利用Excel的BINOMDIST的函数计算二项分布的概率以及累积概
11、率。实验内容及步骤例1-4:一个推销员打了六个电话,推销成功的概率是0.3,建立推销成功次数的概率分布图表。可以按以下步骤建立推销成功次数的概率分布图表。STEP1:如图1-9所示,先在Excel之下建立好概率分布表格的框架。图1-9STEP2:如图1-10所示,先在B7至F7单元格分别输入概率计算公式。图1-10STEP3:公式的拷贝。选取B7至F7单元格,拖动“填充柄”至F13单元格即可完成公式的拷贝操作。结果图1-11所示。图1-11STEP4:下面开始创建二项分布图表。选取B7至B13单元格,选取“插入”菜单的“图表”子菜单。STEP5:选择“柱状图”,然后单击“下一步”。STEP6:
12、单击“系列”标签,单击“分类(X)轴标志”框,并用鼠标选取A7至A13单元格为图表X轴的轴标,然后单击“下一步”。STEP7:分别键入图表名称“二项分布图”,X轴名称“成功次数”,Y轴名称“成功概率”,单击“完成”按扭即可生成二项分布图表。结果说明:如图1-11所示,利用Excel的BINOMDIST的函数可以计算出二项分布的概率以及累积概率。BINOMDIST函数可以带四个参数,各参数的含义分别是:实验成功的次数,实验的总次数,每次实验中成功的概率,是否计算累积概率。四个参数是一个逻辑值,如果为TRUE,函数BINOMDIST返回累积分布函数,如果为FALSE,返回概率密度函数。另外,EXC
13、EL还提供了其它分布的函数,如函数CRITBINOM;函数HYPGEOMDIST;函数NEGBINOMDIST:函数POISSON:正态分布函数NORMDIST:函数NORMSDIST:函数NORMSINV:t分布函数TDIST:有兴趣的同学可以自己研究。实验三随机抽样工具实验目的及要求掌握利用Excel的BINOMDIST的函数计算二项分布的概率以及累积概率。实验内容及步骤Excel中的Rand()函数可以返回大于等于0小于1的均匀分布随机数,Rand()不带任何参数运行,每次计算时时都将返回一个新的数值。RAND()函数可以被用来作为不重复抽样调查的工具。例1-5:如图1-12所示有10个
14、象征性的样本数据,欲从中随机抽取5个数据可按如下步骤操作:图1-12STEP1:选择B2单元格,输入公式“=RAND()”并回车。STEP2:拖动B2单元格右下角的填充柄至B11单元格,并在B1单元格输入标题“RANDOM”。STEP3:选取单元格B2至B11,右击选中的区域选择“复制”,再次右击选中的区域,选择“选择性粘贴”,单击选项“数值”后,点击“确定”按扭。STEP4:选取单元格A2至B11单元格,选择“数据”菜单项下的排序子菜单。STEP5:选取“RANDOM”为主要关键字,然后点击“确定”按扭。排序结果如图1-13所示,A2至A6单元格的样本即为随机抽取的5个样本。图1-13实验四
15、由样本推断总体实验目的及要求掌握利用Excel的几个函数,如求平均函数AVERAGE、标准差函数STDEV、T分布函数TINV等的组合使用构造一个专门用于实现样本推断总体的Excel工作表。实验内容及步骤下面的例子先计算样本的平均数和标准差,然后在一定置信水平上估计总体均值的区间范围。操作步骤:STEP1:构造工作表。如图1-14所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。STEP2:为表格右边的公式计算结果定义左边的变量名。选定A4:B6,A8:B8和A10:B15单元格(先选择第一部分,再按住CTRL键选取另外两个部分),选择“插入”菜单的“名称”子菜单的
16、“指定”选项,用鼠标点击“最左列”选项,然后点击“确定”按扭即可。图1-14STEP3:输入样本数据,和用户指定的置信水平0.95,如图附-13所示。STEP4:为样本数据命名。选定D1:D11单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按扭,得到图1-15所示的计算结果。图1-15结果说明:以上例子说明如何交叉组合使用Excel的公式和函数,以构造出一个能实现样本推断总体有关计算的Excel工作表。实际上,在用Excel进行数据统计处理之时,许多统计功能可以使用和上例类似的方法,通过组合使用Excel的各类统计函数和公式加以实现的。实验五假
17、设检验实验目的及要求掌握利用Excel的正态分布函数NORMSDIST、判断函数IF等,构造一张能够实现在总体方差已知情况下进行总体均值假设检验的Excel工作表。实验内容及步骤例1-6:利用Excel的正态分布函数NORMSDIST、判断函数IF等,构造一张能够实现在总体方差已知情况下进行总体均值假设检验的Excel工作表。操作步骤:STEP1:构造工作表。如图1-16所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。STEP2:为表格右边的公式计算结果定义左边的变量名。选定A3:B4,A6:B8,A10:A11,A13:A15和A17:B19单元格,选择“插入”
18、菜单的“名称”子菜单的“指定”选项,用鼠标点击“最左列”选项,然后点击“确定”按扭即可。图1-16STEP3:输入样本数据,以及总体标准差、总体均值假设、置信水平数据。如图1-17所示。STEP4:为样本数据命名。选定C1:C11单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按扭,得到如图1-17中所示的计算结果。图1-17结果说明:如图1-17所示,该例子的检验结果不论是单侧还是双侧均为拒绝Ho假设。所以,根据样本的计算结果,在5%的显著水平之下,拒绝总体均值为35的假设。同时由单侧显著水平的计算结果还可以看出,在总体均值是35的假设之下,样
19、本均值小于等于31.4的概率仅为0.020303562。实验六双样本等均值假设检验实验目的及要求掌握利用Excel数据分析中提供双样本等均值假设检验工具进行假设检验的方法,并能够解释实验结果。实验内容及步骤例1-7:双样本等均值检验是在一定置信水平之下,在两个总体方差相等的假设之下,检验两个总体均值的差值等于指定平均差的假设是否成立的检验。假设某工厂为了比较两种装配方法的效率,分别组织了两组员工,每组9人,一组采用新的装配方法,另外一组采用旧的装配方法。18个员工的设备装配时间图1-18中表格所示。根据以下数据,是否有理由认为新的装配方法更节约时间?图1-18操作步骤:STEP1:选择“工具”
20、菜单的“数据分析”子菜单,双击“t-检验:双样本等方差假设”选项,则弹出图1-19所示对话框。图1-19STEP2:分别填写变量1的区域:$B$1:$B$10,变量2的区域:$D$1:$D$10,由于我们进行的是等均值的检验,填写假设平均差为0,由于数据的首行包括标志项选择标志选项,所以选择“标志”选项,再填写显著水平为0.05,然后点击“确定”按扭。则可以得到图1-20所示的结果。图1-20结果分析:如图1-20中所示,表中分别给出了两组装配时间的平均值、方差和样本个数。其中,合并方差是样本方差加权之后的平均值,Df是假设检验的自由度它等于样本总个数减2,t统计量是两个样本差值减去假设平均差
21、之后再除于标准误差的结果,“P(T=t)单尾”是单尾检验的显著水平,“t单尾临界”是单尾检验t的临界值,“P(T1之后,都在区间(-0.438,0.438)之间,因此可以认为自相关函数在K1之后截尾,因此我们选用AR(1)模型进行数据拟合。复制C2:C20的数据,将之以值复制的形式复制到D3:D21的单元格,并在D1中填入标志项“Z(-1)”。选择“工具”菜单的“数据分析”子菜单,双击“回归”选项,弹出回归分析对话框。按图附-40所示的方式填写对话框。然后单击“确定”按扭,即可得到AR(1)模型的估计结果。STEP5:按以上操作步骤,可得到图1-41所示AR(1)模型。图1-41结果分析:零均
22、值化模型的估计结果是Z=1.06284*Z(-1),还原成上证指数,最终的时间序列模型是:上证指数估计值-上证指数的平均值=1.06284(上一天上证指数-上证指数平均值)。Excel与数据统计分析统计计算与统计分析强调与计算机密切结合,Excel与数据统计分析旨在提高学生计算机的综合运用能力,用统计方法分析问题、解决问题而编写的。根据教材内容,也可以选择使用SPSS、QSTAT、Evievs、SAS、MINITAB等统计软件。第三章统计整理3.1计量数据的频数表与直方图例3.1(3-1)一、指定接受区域直方图在应用此工具前,用户应先决定分布区间。否则,Excel将用一个大约等于数据集中某数值
23、的平方根作区间,在数据集的最大值与最小值之间用等宽间隔。如果用户自己定义区间,可用2、5或10的倍数,这样易于分析。对于工资数据,最小值是100,最大值是298。一个紧凑的直方图可从区间100开始,区间宽度用10,最后一区间为300结束,需要21个区间。这里所用的方法在两端加了一个空区间,在低端是区间“100或小于100”,高端是区间“大于300”。参考图3.3,利用下面这些步骤可得到频率分布和直方图:1为了方便,将原始数据拷贝到新工作表“指定频数直方图”中。2在B1单元中输入“组距”作为一标记,在B2单元中输入100,B3单元中输入110,选取B2:B3,向下拖动所选区域右下角的+到B22单
24、元。3按下列步骤使用“直方图”分析工具:(1)选择工具菜单之数据分析选项,在分析工具框中“直方图”。如图4所示。图3.1数据分析工具之直方图对话框1)输入输入区域:A1:A51接受区域:B1:B22(这些区间断点或界限必须按升序排列)选择标志2)输出选项输出区域:C1选定图表输出(2)单击确定,Excel将计算出结果显示在输出区域中。图3.2数据分析工具之直方图对话框Excel将把频率分布和直方图放在工作表中,如图3.3所示,输出表的C和D列中包括开始指定的界限。这些界限实际上是每一区间的上限,也就是说,界限实际上是边界。图3.3频数分布与直方图为了使图表更像传统的直方图和更易于理解,可双击图
25、表并对它做如下修改:1图例:因为只有一个系列的数据显示在图表中,所以不需要图例。单击图例(位于图表右侧的“频率”)并按Delete键。2图表区:绘图区是以X和Y轴为边界的矩形区域。通过在柱形上面单击可选取绘图区,单击鼠标右键并选择绘图区格式,将边框改为无并将区域改为无,单击确定。3条宽:在传统的直方图中,柱形是彼此相连接而不是分开的。选择某个柱形,单击鼠标右键,选择数据系列格式,并单击选择标签,将间距宽度从150改为0,单击确定。4X轴标志:选取x轴,单击鼠标右键,选择坐标轴格式,单击对齐标签,将方向从自动改为水平文本,在这种设置下,即使图表已重置尺寸,x轴标记也会变为水平的,单击确定。最后的
26、直方图4.6图3.4修改后的直方图二、不指定接受区域直方图在进行探索性分析时,为了方便,通常不指定接受区域作直方图,步骤如下:(1)选择工具菜单之数据分析选项,在分析工具框中“直方图”。如图4所示。1)输入输入区域:A1:A51接受区域:(该处为空)选择标志2)输出选项输出区域:B1选定图表输出(2)单击确定,得结果。(3)按前面方法对直方图进行进一步修饰即得图3.5图3.5修改后的直方图3.2计数数据的透视表与条图例3.2(3-3)数据见图步骤如下:(1)选择数据菜单之数据透视表和图表报告选项,如图4所示。(2)选择数据源区域(3)选定数据透视表位置,完成(4)将“性别”作为行字段拖至G列,
27、并将“性别”作为数据拖至数据项处,得下表结果同理可得“文化程度”的透视表此时如点击图形按钮,立即得到如下的透视图(5)将“性别”作为行字段拖至行字段处,并将“文化程度”作为列字段拖至列字段处,将“性别”或“文化程度”作为列字段拖至数据字段处得下表结果第四章总量指标和相对指标例4.1(4-13)计算步骤:(1)计算各厂计划完成%E3=D3/C3*100,(2)2000年实际产量为1999年的%F3=D3/B3*100,第五章平均指标5.1简单平均数例5.1某组有学生10人统计课考试成绩为65,82,76,80,82,86,84,88,95,98分,试求其平均指标。平均数的计算步骤如下:(1)将数
28、据输入到A列,根据Excel提供的公式计算各种平均数(2)用Ctrl+可切换到下面的结果:5.2加权平均数例5.2(5-1)原始数据见下图A-D列,其中A、B列放日产量的下限和上限平均数的计算步骤如下:(1)计算日产量的组中值E3=(A3+B3)/2,(2)计算每个组段的总产量F3=C3*E3,G3=D3*E3,(3)计算每月的总产量F8=SUM(F3:F7),G8=Sum(G3:G7),(4)计算平均数公式如下:均数F9=F8/C8G9=G8/D8众数F10=A4+(C4-C3)/(C4-C3+C4-C5)*10G10=A6+(D6-D5)/(D6-D5+D6-D7)*10中位数F11=A4+(C8/2-A4)/C4*10G11=A5+(D8/2-C5)/D5*10第六章变异度指标6.1简单变异度指标例6.1(6-1)变异度指标的计算步骤如下:(1)将甲乙两组数据输入到A,B列,根据Excel提供的公式计算各种变异度指标(2)用Ctrl+可切换到下面的公式:6.2加权变异度指标例6.2(6-2)甲品种的原始数据见下图B-C列,乙品种的原始数据见下图G-H列下面以甲品种的数据计算为例