《学年高中数学 2.2.2 用样本的数字特征估计总体的数字特征1课件 新人教B必修3.ppt》由会员分享,可在线阅读,更多相关《学年高中数学 2.2.2 用样本的数字特征估计总体的数字特征1课件 新人教B必修3.ppt(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.2.2 用样本的数字特征估计用样本的数字特征估计总体的数字特征(一)总体的数字特征(一)2021/8/8 星期日1一、众数、中位数、平均数一、众数、中位数、平均数(1)众数:在样本数据中,频率分布最)众数:在样本数据中,频率分布最大值所对应的样本数据或出现次数最多的大值所对应的样本数据或出现次数最多的那个数据。那个数据。(2)中位数:样本数据中,累计频率为)中位数:样本数据中,累计频率为0.5时所对应的样本数据或将数据按大小时所对应的样本数据或将数据按大小排列,位于最中间的数据(如果数据的个排列,位于最中间的数据(如果数据的个数为偶数,就取当中两个数据的平均数作数为偶数,就取当中两个数据的
2、平均数作为中位数)。为中位数)。2021/8/8 星期日2(3)平均数:样本数据的算术平均数,)平均数:样本数据的算术平均数,即即2021/8/8 星期日3例例1.从某大型企业全体员工某月的月工资从某大型企业全体员工某月的月工资表中随机抽取表中随机抽取50名员工工资资料如下:名员工工资资料如下:800 800 800 800 800 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 12
3、00 1200 1200 1200 1500 1500 1500 1500 1500 1500 1500 2000 2000 2000 2000 2000 25002500 25002021/8/8 星期日4计算这计算这50个数据的众数,中位数和平均数,个数据的众数,中位数和平均数,并估计这个企业员工的平均工资。并估计这个企业员工的平均工资。解:众数是解:众数是1200,中位数是,中位数是1200,平均数是这平均数是这50个数值的和除以个数值的和除以50得得1320.估计这个企业员工的平均工资是估计这个企业员工的平均工资是1320元元.所以用样本的平均数估计总体的平均数所以用样本的平均数估计总
4、体的平均数是是1320元。元。2021/8/8 星期日5 同样,再随机抽取同样,再随机抽取50名员工的工资,名员工的工资,计算所得的样本平均数一般会与例计算所得的样本平均数一般会与例1中的中的样本平均数不同。样本平均数不同。所以用样本的平均数估计总体的平均所以用样本的平均数估计总体的平均数时,样本的平均数只是总体的平均数数时,样本的平均数只是总体的平均数的近似值。的近似值。2021/8/8 星期日6 下面我们用来看样本平均数与样本频下面我们用来看样本平均数与样本频率直方图的联系。率直方图的联系。2021/8/8 星期日7我们知道我们知道,n个样本数据的平均数个样本数据的平均数2021/8/8
5、星期日8则有则有nx=x1+x2+xn.也就是把每个也就是把每个xi(i=1,2,3,n)都用都用x代替代替后,数据总和保持不变。后,数据总和保持不变。所以平均数所以平均数x对数据有对数据有“取齐取齐”的作用,的作用,代表一组数据的数值平均水平。代表一组数据的数值平均水平。在频率分布直方图中,平均数是直方图在频率分布直方图中,平均数是直方图的平衡点,假设横轴是一块放置直方图的的平衡点,假设横轴是一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达跷跷板,则支点取在平均数处时跷跷板达到平衡。到平衡。2021/8/8 星期日9例例2.某工厂人员及工资构成如下:某工厂人员及工资构成如下:人人员员经经
6、理理管理人管理人员员高高级级技技工工工人工人学徒学徒合合计计周工周工资资2200250220200100人数人数16510123合合计计22001500110020001006900(1)指出这个问题中的众数、中位数、平)指出这个问题中的众数、中位数、平均数;均数;(2)这个问题中,平均数能客观地反映该)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?工厂的工资水平吗?为什么?2021/8/8 星期日10解解:(:(1)由表格可知:众数为由表格可知:众数为200,中,中位数为位数为220。平均数为。平均数为300(元(元/周)。周)。(2)虽然平均数为)虽然平均数为300元元/周,但
7、由表格周,但由表格中所列出的数据可见,只有经理在平均中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的用平均数不能客观真实地反映该工厂的工资水平工资水平.2021/8/8 星期日11三种数字特征的比较三种数字特征的比较:(1)样本)样本众数众数通常用来表示通常用来表示分离变量的分离变量的中心值中心值,容易计算,但是它只能表达样本,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述数据中的很少一部分信息,通常用于描述分离变量的中心位置;分离变量的中心位置;(2)中位数中位数不受少数几个极端数据的影
8、不受少数几个极端数据的影响,容易计算,它仅利用了数据中响,容易计算,它仅利用了数据中排在中排在中间间的数据的信息。当样本数据质量比较差,的数据的信息。当样本数据质量比较差,即存在一些错误数据时,应该用抗极端数即存在一些错误数据时,应该用抗极端数据强的中位数表示数据的中心值。据强的中位数表示数据的中心值。2021/8/8 星期日12(3)平均数平均数受样本中的每一个数据的影受样本中的每一个数据的影响,响,“越离群越离群”的数据,对平均数的影响的数据,对平均数的影响也越大,与众数和中位数相比,平均数代也越大,与众数和中位数相比,平均数代表了数据更多的信息,当样本数据质量比表了数据更多的信息,当样本
9、数据质量比较差时,使用平均数描述数据的中心位置较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差。可能与实际情况产生较大的误差。2021/8/8 星期日13 在体育、文艺等各种比赛的评分中,在体育、文艺等各种比赛的评分中,使用的是平均数。计分过程中采用使用的是平均数。计分过程中采用“去去掉一个最高分,去掉一个最低分掉一个最高分,去掉一个最低分”的方的方法,就是为了防止个别裁判的人为因素法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保成较大的影响,从而降低误差,尽量保证公平性。证公平性。2021
10、/8/8 星期日14(4)如果样本平均数大于样本中位数,)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值。之,说明数据中存在许多较小的极端值。在实际应用中,如果在实际应用中,如果同时知道样本中位同时知道样本中位数和样本平均数数和样本平均数,可以使我们了解样本,可以使我们了解样本数据中极端数据的信息,帮助我们作出数据中极端数据的信息,帮助我们作出决策。决策。2021/8/8 星期日15例例3.右面是某校学右面是某校学生日睡眠时间的抽生日睡眠时间的抽样频率分布表(单样频率分布表(单位:位:h),试估计该),试估计
11、该校学生的日平均睡校学生的日平均睡眠时间。眠时间。睡眠时间睡眠时间 人数人数频率频率6,6.5)50.056.5,7)170.177,7.5)330.337.5,8)370.378,8.5)60.068.5,920.0210012021/8/8 星期日16解解1:总睡眠时间约为:总睡眠时间约为 6.255+6.7517+7.2533+7.7537+8.256+8.752=739(h)故平均睡眠时间约为故平均睡眠时间约为7.39h解解2:求各组:求各组中值与对应频率之积中值与对应频率之积的和,的和,6.250.05+6.750.17+7.250.33+7.7537+8.250.06+8.750.
12、02=7.39(h)估计该校学生的日平均睡眠时间约为估计该校学生的日平均睡眠时间约为7.39h2021/8/8 星期日17例例4.某单位年收入在某单位年收入在10000到到15000、15000到到20000、20000到到25000、25000到到30000、30000到到35000、35000到到40000及及40000到到50000元之间的职工所占的比分别元之间的职工所占的比分别为为10%,15%,20%,25%,15%,10%和和5%,试估计该单位职工的平均年收入。,试估计该单位职工的平均年收入。2021/8/8 星期日18解:估计该单位职工的平均年收入为解:估计该单位职工的平均年收入为 1250010%+1750015%+2250020%+2750025%+3250015%+3750010%+450005%=26125(元元)答:估计该单位人均年收入约为答:估计该单位人均年收入约为26125元元.2021/8/8 星期日19练习题:练习题:1.若若M个数的平均数是个数的平均数是x,N个数的平均数个数的平均数是是y,则这,则这M+N个数的平均数是个数的平均数是 .,和和的样本平均数分别是的样本平均数分别是 x 和和 y,那么一组数那么一组数的平均数是的平均数是2.如果两组数如果两组数 .2021/8/8 星期日202021/8/8 星期日21