用样本估计总体2.2.1用样本的频率分布估计总体分布.ppt

上传人:wuy****n92 文档编号:66097155 上传时间:2022-12-14 格式:PPT 页数:38 大小:1.17MB
返回 下载 相关 举报
用样本估计总体2.2.1用样本的频率分布估计总体分布.ppt_第1页
第1页 / 共38页
用样本估计总体2.2.1用样本的频率分布估计总体分布.ppt_第2页
第2页 / 共38页
点击查看更多>>
资源描述

《用样本估计总体2.2.1用样本的频率分布估计总体分布.ppt》由会员分享,可在线阅读,更多相关《用样本估计总体2.2.1用样本的频率分布估计总体分布.ppt(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、用样本估计总体用样本的频率分布估计总体分布统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本从总体中抽取一个样本,根据样本的根据样本的情况去估计总体的相应情况情况去估计总体的相应情况.具体步骤一是如何从总体中抽取样本?二是如何根据对样本的整理、计算、分析二是如何根据对样本的整理、计算、分析,对总体的情况作出推断对总体的情况作出推断.(1、用样本频率分布用样本频率分布估计总体分布,估计总体分布,2、用样本的某种数字特征、用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数(例如平均数、方差等)去估计总体的相应数字特征。)字特征。)几个基本概念 1、频

2、数:频数:将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数频数。2、频率:每组数据的个数除以总数据个数的商叫做该组的频率频率。3、样本的频率分布:样本的频率分布:根据随机抽取样本的大小,分别计算某一事件出现的频率分别计算某一事件出现的频率,这这些频率的分布规律些频率的分布规律,就叫做样本的频率分样本的频率分布布。一、用样本的频率分布估计总体分布如何用样本的频率分布如何用样本的频率分布估计总体分布?估计总体分布?引例:我国是世界上严重缺水的国家之一,城市缺水问题较为突出。2000年全国主要城市中缺水情况排在前10位的城市 例:例:某市政府为了节约生活用水,计划在本市试行居民生活用水

3、定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那如果希望大部分居民的日常生活不受影响,那 么标准么标准a定为多少比较合理呢定为多少比较合理呢?为了较合理地确定这个标准,为了较合理地确定这个标准,你认为你认为需要做需要做 哪些工作?哪些工作?思考:由上表,大家可以得到什么信息?由上表,大家可以得到什么信息?通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月平均用位居民某年的月平均用 水量水量(单位:单位:t)t),如下表:,如下表:1.1.求极差求极差:步骤:步骤:频率分布直方图频率分布直方图

4、 2.2.决定组距与组数决定组距与组数:组数组数=4.3 4.3-0.2=4.10.2=4.14.14.10.50.5=8.2=8.2组距组距极差极差=3.3.将数据分组将数据分组0 0,0.50.5),0.50.5,1 1),4 4,4.54.5 4.4.列频率分布表列频率分布表100100位居民月平均用水量的频率分布表位居民月平均用水量的频率分布表频率频率/组组距距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5.5.画频率分布直方图画频率分布直方图v思考思考:如果当地政府希望使如果当地政府希望使 85%以

5、上的居民每以上的居民每月的用水量不超出标准,根据频率分布表月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量和频率分布直方图,你能对制定月用水量标准提出建议吗?标准提出建议吗?注意注意 1、小正方形的面积=组距频率/组距=频率 2、各小正方形的面积之和等于1.3、每一小组频率实际上反映样本数据落在各个小组的比例大小。一一、求求极差,极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与与组数组数:组距:组距=极差极差/组数组数三、分组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开左闭右开区间区间,最后一组取闭区间最后一

6、组取闭区间四、登记频数四、登记频数,计算频率计算频率,列出列出频率分布表频率分布表总结:画一组数据的频率分布直方图总结:画一组数据的频率分布直方图,可可以按以下的步骤进行以按以下的步骤进行:五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)练练 习习1.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图

7、画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5,24.5)的)的百分比是多少百分比是多少?解解:组距为组距为3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.0501

8、2.5 15.50.0600.0702.已知样本已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为那么频率为0.2范围的是范围的是 ()A.5.57.5 B.7.59.5 C.9.511.5 D.11.513.5 分组分组 频数频数 频率频率 频数累计频数累计 5.57.5 2 0.1 2 7.59.5 6 0.3 8 9.511.5 8 0.4 1611.513.5 4 0.2 20 合计合计 20 1.0D3.一个容量为一个容量为100的样本的样本,数据的分组和各组的相数据的分组和各组的相关信息如下表关信息如下表,试完

9、成表中每一行的两个空格试完成表中每一行的两个空格.分组 频数 频率 频率累计12,15)615,18)0.0818,21)0.3021,24)2124,27)0.6927,30)1630,33)0.1033,36 1.00合计合计 100 1.00课堂小结课堂小结编制频率分布直方图的步骤编制频率分布直方图的步骤:找最大值与最小值。找最大值与最小值。决定组距与组数决定组距与组数决定分点决定分点登记频数,计算频率,列表,画直方图登记频数,计算频率,列表,画直方图说明说明:(1)确定分点时确定分点时,使分点比数据多一位小数使分点比数据多一位小数,并且把第并且把第1小组的起小组的起点稍微再小一点点稍微

10、再小一点.频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图中连接频率分布直方图中各小长方形上端的中点各小长方形上端的中点,得到得到频率分布折线图频率分布折线图总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。用用样样本本分分布布直直方方图图去去估估计计相相应应的的总总体体分分布布时时,一一般般样样本本容容量量越越大大,频频率

11、率分分布布直直方方图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总体体的的分分布布规规律律,即即越越精精确确地地反反映映了了总总体体在在各各个个范范围围内内取取值值百分比。百分比。总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是研研究究总总体分布的工具体分布的工具.总体密度曲线总体密度曲线茎叶图茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:始记录如下:(1)甲运动员得分:甲运动员得分:13,51

12、,23,8,26,38,16,33,14,28,39(1)乙运动员得分乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 336 843 8 9 1 叶就是从茎的旁边生长出来的数,表示得分的个位数。茎是指中间的一列数,表示得分的十位数 茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。在样本数据较少时,用茎叶图表示数据的效果较好。它不但可

13、以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。第一课时 众数、中位数、平均数2.2.2 用样本的数字特征估计总用样本的数字特征估计总体的数字特征体的数字特征一一 众数、中位数、平均数的概念众数、中位数、平均数的概念 中数中数:将一组数据按:将一组数据按大小依次排列大小依次排列,把处在把处在最中间位置最中间位置的一个数据(或的一个数据(或最中间最中间两个数据的平均数两个数据的平均数)叫做这组数据的中位)叫做这组数据的中位数数 众数众数:在一组数据中,出现次数:在一

14、组数据中,出现次数最多最多的数据叫做这组数据的众数的数据叫做这组数据的众数 平均数:一组数据的算术平均数,即 x=练习练习:在一次中学生田径运动会上,在一次中学生田径运动会上,参加男子跳高的参加男子跳高的17名运动员的成绩如下名运动员的成绩如下表所示:表所示:成成绩绩(单单位:位:米米)1.501.601.651.701.751.801.851.90人数人数23234111分别求这些运动员成绩的众数,中位数与分别求这些运动员成绩的众数,中位数与平均数平均数 平均数平均数:一组数据的一组数据的算术平均数算术平均数,即即 x=解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现的次,

15、出现的次数最多,即这组数据的众数是次数最多,即这组数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大的个数据可看成是按从小到大的顺序排列的,其中第顺序排列的,其中第9个数据个数据1.70是最中间的一是最中间的一个数据,即这组数据的中位数是个数据,即这组数据的中位数是1.70;这组数据的平均数是这组数据的平均数是答:答:17名运动员成绩的众数、中位数、平均数名运动员成绩的众数、中位数、平均数依次是依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)(米).二二、众数、中位数、平均数众数、中位数、平均数与频率分布直方图的关系与频率分布直方图的关系 1、众数在样本数

16、据的频率分布直方图众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。中,就是最高矩形的中点的横坐标。例如,在上一节调查的例如,在上一节调查的100位居民的月位居民的月均用水量的问题中,从这些样本数据的频率均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是分布直方图可以看出,月均用水量的众数是2.25t.如图所示:如图所示:频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)2、在样本中,有在样本中,有50的个体小于或等于的个体小于或等于中位数,也有中位数,也有50的个体大于或等于中位的

17、个体大于或等于中位数数,因此,在频率分布直方图中,中位数左,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为均用水量的中位数的估计值,此数据值为2.02t.频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)3、平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”.用频率分布直方图估计平均数方法用频率分布直方图估计平均数方法是是平均数平均数图中

18、每一个小矩形的面积图中每一个小矩形的面积小矩小矩形底边中点的横坐标之和形底边中点的横坐标之和三三 三种数字特征的优缺点三种数字特征的优缺点 1、众数体现了样本数据的最大集中、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无点,但它对其它数据信息的忽视使得无法客观地反映总体特征法客观地反映总体特征.如上例中众数是如上例中众数是2.25t,它告诉我们它告诉我们,月均用水量为月均用水量为2.25t的的居民数比月均用水量为其它数值的居民居民数比月均用水量为其它数值的居民数多数多,但它并没有告诉我们多多少但它并没有告诉我们多多少.2、中位数是样本数据所占频率、中位数是样本数据所占频率的等分

19、线,它不受少数几个极端值的的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量如上例中假设有某一用户月均用水量为为10t,那么它所占频率为,那么它所占频率为0.01,几乎几乎不影响中位数不影响中位数,但显然这一极端值是不但显然这一极端值是不能忽视的。能忽视的。3、由于平均数与每一个样本的、由于平均数与每一个样本的数据有关,所以任何一个样本数据的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众改变都会引起平均数的改变,这是众数、中位数都不

20、具有的性质。也正因数、中位数都不具有的性质。也正因如此如此,与众数、中位数比较起来,平,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时端值的影响较大,使平均数在估计时可靠性降低。可靠性降低。四四 众数、中位数、平均数的众数、中位数、平均数的简单应用简单应用例例 某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理管理人员管理人员高级技工高级技工工人工人学徒学徒合计合计周工资周工资2200250220200100人数人数16510123合计合

21、计22001500110020001006900(1)指出这个问题中周工资的众数、中)指出这个问题中周工资的众数、中位数、平均数位数、平均数(2)这个问题中,工资的平均数能客观)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?地反映该厂的工资水平吗?为什么?分析分析:众数为:众数为200,中位数为,中位数为220,平均数为,平均数为300。因平均数为因平均数为300,由表格中所列出,由表格中所列出的数据可见,只有经理在平均数以上,的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资数不能客观真实地反映该工厂的工资水平。水平。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁