《222用样本的数字特征估计总体的数字特征优质课.ppt》由会员分享,可在线阅读,更多相关《222用样本的数字特征估计总体的数字特征优质课.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、222用样本的数字特征估计总体的数字特征优质课一一 众数、中位数、平均数的概念众数、中位数、平均数的概念中位数:将一组数据按大小依次排列,把处在中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据或最中间两个数据的最中间位置的一个数据或最中间两个数据的平均数叫做这组数据的中位数平均数叫做这组数据的中位数.众数众数:在一组数据中,出现次数最多的数据叫:在一组数据中,出现次数最多的数据叫做这组数据的众数做这组数据的众数 平均数平均数:一组数据的算术平均数一组数据的算术平均数,即即 问题1:众数、中位数、平均数这三个数一般都会来自于同一个总体或样本,它们能说明总体或样本的什么性质?平均数平均
2、数:反映所有数据的平均程度反映所有数据的平均程度 众数众数:反映的往往是部分较集中的数据信息反映的往往是部分较集中的数据信息 中位数中位数:是位置型数,反映处于中间部位的是位置型数,反映处于中间部位的 数据信息数据信息 1、求以下各组数据的众数、求以下各组数据的众数1、1,2,3,3,3,5,5,8,8,8,9,9众数是:3和82、1,2,3,3,3,5,5,8,8,9,9众数是:32、求以下各组数据的中位数、求以下各组数据的中位数1、1,2,3,3,3,4,6,8,8,8,9,921,2,3,3,3,4,8,8,8,9,9中位数是:5中位数是:4 3、在一次中学生田径运动会上,参加男子跳高的
3、17名运发动的成绩如下表所示:成成绩绩(米米)150160165170175180185190人数人数23234111分别求这些运发动成绩的众数,中位数与平均数分别求这些运发动成绩的众数,中位数与平均数。解:在解:在17个数据中,出现了个数据中,出现了4次,出现的次数最多,即次,出现的次数最多,即这组数据的众数是这组数据的众数是上面表里的上面表里的17个数据可看成是按从小到大的顺序排列个数据可看成是按从小到大的顺序排列的,其中第的,其中第9个数据是最中间的一个数据,即这组数据的个数据是最中间的一个数据,即这组数据的中位数是;中位数是;答:17名运发动成绩的众数、中位数、平均数依次是米、米、米。
4、这组数据的平均数是这组数据的平均数是 二、众数、中位数、平均数与频率众数、中位数、平均数与频率分布直方图的关系分布直方图的关系频率频率组距组距O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)众数在样本数据的频率分布直方图中,众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。就是最高矩形的中点的横坐标。如何在频率分布直方图中估计众数如何在频率分布直方图中估计众数可将众数看作直方图中面积最大长方形的可将众数看作直方图中面积最大长方形的“中心中心2143频率频率组距组距前四个小矩形的前四个小矩形的面积和面积和后四个小矩形的后四个小矩形的面积和面积和如何在频率
5、分布直方图中估计中位数如何在频率分布直方图中估计中位数分组分组0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3)3,3.5)3.5,4)4,4.5合计合计频率频率0.040.080.150.220.250.140.060.040.021在样本中中位数的左右各有在样本中中位数的左右各有50%的样本数,的样本数,条形面积各为条形面积各为0.5,所以反映在直方图中位数所以反映在直方图中位数左右的面积相等左右的面积相等.,中位数中位数)可将中位数看作整个直方图面积的可将中位数看作整个直方图面积的“中心中心考虑讨论以下问题:考虑讨论以下问题:1、这个中位数的估计值,与样本的中、这个
6、中位数的估计值,与样本的中位数值不一样,你能解释其中原因吗位数值不一样,你能解释其中原因吗?答:这个中位数的估计值答:这个中位数的估计值,与样本的中位数与样本的中位数值不一样,这是因为样本数据的频率分布值不一样,这是因为样本数据的频率分布直方图,只是直观地说明分布的形状,但直方图,只是直观地说明分布的形状,但是从直方图本身得不出原始的数据内容,是从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。所以由频直方图已经损失一些样本信息。所以由频率分布直方图得到的中位数估计值往往与率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致样本的实际中位数值不一致.如何在频率分布直方图中估
7、计平均数如何在频率分布直方图中估计平均数=2.02 平均数的估计值等于频率分平均数的估计值等于频率分布直方图中每个小矩形的面布直方图中每个小矩形的面积乘以小矩形底边中点的横积乘以小矩形底边中点的横坐标之和。坐标之和。可将平均数看作整个直方图面积的可将平均数看作整个直方图面积的“重心重心 考虑讨论以下问题:考虑讨论以下问题:2、样本中位数不受少数极端值的影响,、样本中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点。极端值的不敏感有时也会成为缺点。你能举例说明吗?你能举例说明吗?答:优点:对极端数据不敏感的方法可以答:优点:
8、对极端数据不敏感的方法可以有效地预防错误数据的影响。有效地预防错误数据的影响。对极端值不敏感有利的例子对极端值不敏感有利的例子:例如当样本数例如当样本数据质量比较差,即存在一些错误数据如据质量比较差,即存在一些错误数据如数据录入错误、测量错误等时,用抗极数据录入错误、测量错误等时,用抗极端数据强的中位数表示数据的中心值更准端数据强的中位数表示数据的中心值更准确。确。缺点:缺点:1出现错误的数据也不知道;出现错误的数据也不知道;2对极端值不敏感有弊的例子:某人具对极端值不敏感有弊的例子:某人具有初级计算机专业技术程度,想找一份收有初级计算机专业技术程度,想找一份收入好的工作。这时假如采用各个公司
9、计算入好的工作。这时假如采用各个公司计算机专业技术人员收入的中位数作为选择工机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术程度很可能所选择公司的初级计算机专业技术程度人员的收入很低,其原因是中位数对极小的数人员的收入很低,其原因是中位数对极小的数据不敏感。这里更好的方法是同时用平均工资据不敏感。这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业中位数较大的公司就业.例例1、下表是七位评委给某参赛选手的打分,总分为、下表是七位评委给
10、某参赛选手的打分,总分为10分,分,你认为如何计算这位选手的最后得分才较为合理?你认为如何计算这位选手的最后得分才较为合理?评委 1号2号3号4号5号6号7号打分 9.69.39.39.69.99.39.4提问:提问:1、电视里评委是怎样给选手打分的?、电视里评委是怎样给选手打分的?2、为什么这么做?直接取中位数和众数的值不好么?、为什么这么做?直接取中位数和众数的值不好么?三、众数、中位数、平均数的简单应用众数、中位数、平均数的简单应用特征数特征数 众数众数中位数中位数平均数平均数去掉一个最高分和去掉一个最高分和最低分后的平均分最低分后的平均分去掉两个最高分去掉两个最高分和最低分后的平和最低
11、分后的平均分均分特征值特征值 9394949942944例例2 某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理管理人员管理人员高级技工高级技工工人工人学徒学徒合计合计周工资周工资2200 250220200100人数人数16510123合计合计2200 15001100200010069001指出这个问题中周工资的众数、中位数、平均数指出这个问题中周工资的众数、中位数、平均数2这个问题中,工资的平均数能客观地反映该厂的工资程这个问题中,工资的平均数能客观地反映该厂的工资程度吗?为什么?度吗?为什么?分析:众数为200,中位数为220,平均数为300。因平均数为300,由表
12、格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资程度。课堂练习:课堂练习:1、假设你是一名交通部门的工作人员。你打算向市长报告国、假设你是一名交通部门的工作人员。你打算向市长报告国家对本市家对本市26条公路工程投资的平均资金数额,其中一条新公条公路工程投资的平均资金数额,其中一条新公路的建立投资为路的建立投资为2 200万元人民币,另外万元人民币,另外25个工程的投资在个工程的投资在20万与万与100万中位数是万中位数是25万,平均数是万,平均数是100万,众数是万,众数是20万元。万元。你会选择哪一种数字特征来表示每一个工程的国家投
13、资?你你会选择哪一种数字特征来表示每一个工程的国家投资?你选择这种数字特征的缺点是什么?选择这种数字特征的缺点是什么?选择平均数更好:因为,此时的众数选择平均数更好:因为,此时的众数20万比中位数万比中位数25万还小,万还小,所以众数代表的是部分的数。中位数代表的虽然是大多数公路所以众数代表的是部分的数。中位数代表的虽然是大多数公路投资的数额,但由于其不受极端值的影响,不能代表全体,因投资的数额,但由于其不受极端值的影响,不能代表全体,因此此时成了它的缺点。选择平均数较好,能比较好的代表整体此此时成了它的缺点。选择平均数较好,能比较好的代表整体程度,但缺点是仍不能显示出详细的数字特征程度,但缺
14、点是仍不能显示出详细的数字特征 二情境一情境一;甲.乙两名射击队员,在进展的十次射击中成绩分别是:甲乙试问二人谁发挥的程度较稳定?分析:甲的平均成绩是9环.乙的平均成绩也是9环.一一.实例引入实例引入情境二情境二:某农场种植了甲、乙两种玉米苗,从中各抽取某农场种植了甲、乙两种玉米苗,从中各抽取了了1010株,分别测得它们的株高如下:株,分别测得它们的株高如下:(单位单位cm)cm)甲:甲:31 32 35 37 33 30 32 31 30 29 乙:乙:53 16 54 13 66 16 13 11 16 62问问:哪种玉米苗长得高?哪种玉米苗长得高?哪种玉米苗长得齐?哪种玉米苗长得齐?怎怎
15、么么办办呢呢?甲甲37最大值最大值29最小值最小值8乙乙66最大值最大值11最小值最小值55极极 差差 甲甲:31 32 35 37 33 30 32 31 30 29 乙乙:53 16 54 13 66 16 13 11 16 62甲甲32372937321166乙乙极差:极差:一组数据的最大值与最小值的差一组数据的最大值与最小值的差极差越大,数据越分散,越不稳定极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差越小,数据越集中,越稳定极差表达了数据的离散程度极差表达了数据的离散程度离散程度离散程度 为了对两人射击程度的稳定程度为了对两人射击程度的稳定程度,玉米生长的玉米生长的高
16、度差异以及钢筋质量优劣做个合理的评价高度差异以及钢筋质量优劣做个合理的评价,这这里我们引入了一个新的概念里我们引入了一个新的概念,方差和标准差方差和标准差.设一组样本数据设一组样本数据 ,其平均数为,其平均数为 ,那么,那么称称s2为这个样本的为这个样本的方差方差,称为这个样本的称为这个样本的标准差标准差,分别称为样本方差、样本标准差,分别称为样本方差、样本标准差它的算术平方根它的算术平方根x1,x2,xnv样本中各数据与样本平均数的差的平方样本中各数据与样本平均数的差的平方和的平均数叫做和的平均数叫做样本方差;样本方差;样本方差的样本方差的算术平方根叫做算术平方根叫做样本标准差样本标准差。样
17、本方差。样本方差和样本标准差都是衡量一个样本和样本标准差都是衡量一个样本波动大波动大小小的量,样本方差或样本标准差越大,的量,样本方差或样本标准差越大,样本数据的波动就越大。样本数据的波动就越大。例例1.计算数据计算数据89,93,88,91,94,90,88,87的的方差和标准差。标准差结果准确到方差和标准差。标准差结果准确到 解:解:.所以这组数据的方差为,标准差为所以这组数据的方差为,标准差为2.3.见课本见课本76-77页页练习:假设甲、乙两队比赛情况如下练习:假设甲、乙两队比赛情况如下,以下说法哪些以下说法哪些 说法是不正确的:说法是不正确的:甲甲乙乙平均失球数平均失球数平均失球个数
18、的标准差平均失球个数的标准差1.52.11.10.41、平均来说,甲的技术比乙的技术好;、平均来说,甲的技术比乙的技术好;2、乙比甲技术更稳定;、乙比甲技术更稳定;3、甲队有时表现差,有时表现好;、甲队有时表现差,有时表现好;4、乙队很少不失球。、乙队很少不失球。全对全对例例2:甲、乙两种水稻试验品种连续:甲、乙两种水稻试验品种连续5年的平均单位面积产量如年的平均单位面积产量如下单位:下单位:t/hm,试根据这组数据估计哪一种水稻品种的,试根据这组数据估计哪一种水稻品种的产量比较稳定产量比较稳定 品种品种第一年第一年第二年第二年第三年第三年第四年第四年第五年第五年甲甲989910110102乙
19、乙941031089798解:1 1、在一次歌手大奖赛上,七位评委为歌手打出的分、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:,去掉一个最高分和一个最低数如下:,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为分后,所剩数据的平均值和方差分别为_;2 2、已知数据、已知数据 的方差为的方差为2 2,则求数据,则求数据 的方差。的方差。,三三.当堂反响当堂反响考虑一下:假如数据假如数据的平均数为的平均数为 ,方差为方差为1 1新数据新数据的平均数为的平均数为,方差仍为,方差仍为 2 2新数据新数据的平均数为的平均数为,方差为,方差为 3 3新数据新数据的平均数为的平均数为 ,方差为方差为 ,那么,那么方差的运算性质:方差的运算性质:练习:练习:3假设假设k1,k2,k8的方差为的方差为3,那么,那么2(k13),2(k23),2(k83)的方差为的方差为_43212AB