《《均值方差标准差》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《均值方差标准差》PPT课件.ppt(24页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、总体特征数:总体特征数:在数学中,通常把能反映总体某种特征的量称为在数学中,通常把能反映总体某种特征的量称为总体特征数总体特征数如何反映总体的特征数?如何反映总体的特征数?用用样本样本的特征数估计的特征数估计总体总体的特征数!的特征数!情境引入一情境引入一:在利用单摆检验重力加速度的实验中,全班同学在在利用单摆检验重力加速度的实验中,全班同学在相同的条件下进行测试,得到下列数据(单位:相同的条件下进行测试,得到下列数据(单位:m/s)m/s)9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.329.76 9.45 9.99 9.81 9.56 9.78 9
2、.72 9.93 9.949.65 9.79 9.42 9.68 9.70 9.84 9.90怎样利用这些数据对重力加速度进行估计?怎样利用这些数据对重力加速度进行估计?数数均均平平问题转化为:问题转化为:实验结果测得一组数据为实验结果测得一组数据为用用 作为重力加速度作为重力加速度“最理想的最理想的”近似近似值,依据是什么呢?值,依据是什么呢?算术平均数算术平均数=读作:读作:平均平均 处理实验数据的原则是使这个近似值与实验数处理实验数据的原则是使这个近似值与实验数据之间的离差(偏差)最小、设近似值为据之间的离差(偏差)最小、设近似值为x,则它与则它与n个实验值个实验值 ai(i1,2,3,
3、n)的的离差分别为离差分别为 x-a1,x-a2,x-an平均数最能代表一个样本数据的集中趋势,平均数最能代表一个样本数据的集中趋势,也就是说它与样本数据的离差最小。也就是说它与样本数据的离差最小。称为这称为这n n个数的个数的 平均数或者均值平均数或者均值例1 某校高一年级的甲乙两个班级(均为某校高一年级的甲乙两个班级(均为50人)的人)的数学成绩如下(总分数学成绩如下(总分150),试确定这次考试中,哪),试确定这次考试中,哪个班的数学成绩更好一些个班的数学成绩更好一些.甲班甲班 乙班乙班 甲班均分甲班均分 乙班均分乙班均分112861068410010598102941078711294
4、9499901209895119108100961151111049510811110510410711910793102981121129992102938494941009084114116951099610698108991101039498105101115104112101113961081001109810787108106103971071061111219710711412210110710711111410610410495111111110 思考思考某公司内部结构以及工资分布:某公司内部结构以及工资分布:人员经理管理人员技工工人 学徒 合计月工资11000125011001
5、000500人数165101023 某公司有经理某公司有经理1人,另有人,另有6名管理人员,名管理人员,5名高级名高级技工,技工,10名工人和名工人和10名学徒,现需要增加一名新工人。名学徒,现需要增加一名新工人。小张前来应聘,经理说:小张前来应聘,经理说:“我公司报酬不错,平均工我公司报酬不错,平均工资每月资每月1695元。元。”小张工作几天后找到经理说:小张工作几天后找到经理说:“你你欺骗了我,我问过其他工人,每月一个人的工资超过欺骗了我,我问过其他工人,每月一个人的工资超过1500元,平均月工资怎么能是元,平均月工资怎么能是1695元呢?元呢?”经理拿出经理拿出如下表所示的工资表说:如下
6、表所示的工资表说:“你看,平均周工资就是你看,平均周工资就是1695元。元。”在这个问题中,总体月平均数能客观地反映工人的在这个问题中,总体月平均数能客观地反映工人的月工资水平吗?为什么?月工资水平吗?为什么?总体月平均数不能反映工人的月工资水平,总体月平均数不能反映工人的月工资水平,总体月平均数不能反映工人的月工资水平,总体月平均数不能反映工人的月工资水平,因为公司中少数人的月工资额与大多因为公司中少数人的月工资额与大多因为公司中少数人的月工资额与大多因为公司中少数人的月工资额与大多 数人数人数人数人的月工资额差别较大,这样导致平均的月工资额差别较大,这样导致平均的月工资额差别较大,这样导致
7、平均的月工资额差别较大,这样导致平均 数与数与数与数与中位数的偏差较大,所以月平均数不中位数的偏差较大,所以月平均数不中位数的偏差较大,所以月平均数不中位数的偏差较大,所以月平均数不 能反能反能反能反映这个公司工人的月工资水平,而应映这个公司工人的月工资水平,而应映这个公司工人的月工资水平,而应映这个公司工人的月工资水平,而应 该应该应该应该应用中位数或众数来反映工人的月工资用中位数或众数来反映工人的月工资用中位数或众数来反映工人的月工资用中位数或众数来反映工人的月工资 水平水平水平水平 在这个问题中,总体月平均数能客观地反映工人的在这个问题中,总体月平均数能客观地反映工人的月工资水平吗?为什
8、么?月工资水平吗?为什么?例例2 2 高一(高一(1)班学生年龄统计:)班学生年龄统计:(班级共有班级共有43人)人)其中有其中有20人人18岁,岁,13人人17岁,岁,7人人16岁,岁,3人人15岁,求该班级的平均年龄。岁,求该班级的平均年龄。分析分析在班级年龄序列中在班级年龄序列中18出现了出现了20次,次,17出现了出现了13次,次,16出现了出现了7次,次,15出现了出现了3次次解:解:“加权平均数加权平均数”15加权平均值加权平均值(用(用频率频率计算平均值)计算平均值)一般地,若取值为一般地,若取值为 ,出现的次数分别为出现的次数分别为 ,设频率为,设频率为 则其加权平均数为则其加
9、权平均数为其中其中例例3 3:由下表估计学生日平均睡眠时间:由下表估计学生日平均睡眠时间睡眠时间睡眠时间人数人数频率频率6,6.5)50.056.5,7)170.177,7.5)330.337.5,8)370.378,8.5)60.068.5,920.02合合 计计1001收入范围收入范围所占百分所占百分比比1000010000 至至 150001500010%10%1500015000 至至 200002000015%15%2000020000 至至 250002500020%20%2500025000 至至 300003000025%25%3000030000 至至 35000350001
10、5%15%3500035000 至至 400004000010%10%4000040000 至至 50000500005%5%例例4 4:由某单位年收入表试估计该单位职工:由某单位年收入表试估计该单位职工 的平均年输入的平均年输入有甲乙两种钢筋,现从中各抽取一个样本有甲乙两种钢筋,现从中各抽取一个样本检查它们的抗拉强度,如下表:检查它们的抗拉强度,如下表:甲甲110120130125120125135125135125乙乙115100125130115125125145125145110115105120125130135140110115105120125130135140甲甲乙乙10014
11、5哪种钢筋的质量较好?哪种钢筋的质量较好?11012125130情境引入二情境引入二:一组数据的最大值与最小值的差称为一组数据的最大值与最小值的差称为极差极差;说明甲比乙稳定说明甲比乙稳定思思 考考:什么样的指标可以反映一组数据什么样的指标可以反映一组数据 变化范围的大小?变化范围的大小?极差最大值最小值极差最大值最小值 甲甲110115105120125130135140110115105120125130135140乙乙100145极差越大,数据越分散,越不稳定极差越大,数据越分散,越不稳定极差越大,数据越分散,越不稳定极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差越小,数
12、据越集中,越稳定极差越小,数据越集中,越稳定极差越小,数据越集中,越稳定极差体现了数据的极差体现了数据的离散程度离散程度 某农场种植了甲、乙两种玉米苗,从中各抽取某农场种植了甲、乙两种玉米苗,从中各抽取了了1010株,分别测得它们的株高如下:株,分别测得它们的株高如下:甲:甲:31 32 35 37 33 30 32 31 30 29 乙:乙:53 16 54 13 66 16 13 11 16 62问问:哪种玉米苗长得哪种玉米苗长得高高?哪种玉米苗长得哪种玉米苗长得齐齐?怎怎么么办办呢呢?甲甲37(最大值)(最大值)29(最小值)(最小值)8乙乙66(最大值)(最大值)11(最小值)(最小值
13、)55极极 差差 甲甲:31 32 35 37 33 30 32 31 30 29 乙乙:53 16 54 13 66 16 13 11 16 62甲甲32372937321166乙乙 如果甲乙两组数据的集中程度差异不大时,怎如果甲乙两组数据的集中程度差异不大时,怎么办呢?么办呢?我们可以考虑每一株的高度与平均高度的离差离差的平方和越小,长的越齐离差的平方和越小,长的越齐 考察样本数据的分散程度的大小考察样本数据的分散程度的大小考察样本数据的分散程度的大小考察样本数据的分散程度的大小,最常用的统计最常用的统计最常用的统计最常用的统计量是量是量是量是方差和标准差方差和标准差方差和标准差方差和标准
14、差。样本中各数据与样本平均数的差的平方和的平样本中各数据与样本平均数的差的平方和的平均数叫做样本均数叫做样本方差方差;样本方差的算术平方根叫做样本样本方差的算术平方根叫做样本标准差标准差。设一组样本数据设一组样本数据 ,其平均数为,其平均数为 ,则,则称称s2为这个样本的为这个样本的方差,方差,称为这个样本的称为这个样本的标准差标准差,分别称为,分别称为样本方差、样本标准差样本方差、样本标准差 即即它的算术平方根它的算术平方根 因为方差与原始数据的单位不同,且平方后可能夸大因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们标准差来刻画一组数据的稳定了离差的程度,我们标准差来刻画一
15、组数据的稳定 程程度度 方差和标准差的意义:方差和标准差的意义:描述一个样本和总体的波动(离散程度)大小的描述一个样本和总体的波动(离散程度)大小的特征数,标准差大说明波动大特征数,标准差大说明波动大.如果数据如果数据的平均数为的平均数为 ,方差为方差为(1 1)新数据)新数据的平均数为的平均数为,方差仍为,方差仍为 (2 2)新数据)新数据的平均数为的平均数为,方差为,方差为 (3 3)新数据)新数据的平均数为的平均数为 ,方差为方差为 ,则,则方差的运算性质:方差的运算性质:极差、方差与标准差的区别和联系:极差、方差与标准差的区别和联系:都是用来描述数据的离散程度,其中极差都是用来描述数据
16、的离散程度,其中极差都是用来描述数据的离散程度,其中极差都是用来描述数据的离散程度,其中极差是数据最大值与最小值的差,反映了一组数据是数据最大值与最小值的差,反映了一组数据是数据最大值与最小值的差,反映了一组数据是数据最大值与最小值的差,反映了一组数据的变化的最大幅度,它对一组数据中的极端值的变化的最大幅度,它对一组数据中的极端值的变化的最大幅度,它对一组数据中的极端值的变化的最大幅度,它对一组数据中的极端值非常敏感。方差反映一组数据围绕平均数波动非常敏感。方差反映一组数据围绕平均数波动非常敏感。方差反映一组数据围绕平均数波动非常敏感。方差反映一组数据围绕平均数波动的大小,标准差是以样本数据为
17、单位表示波动的大小,标准差是以样本数据为单位表示波动的大小,标准差是以样本数据为单位表示波动的大小,标准差是以样本数据为单位表示波动幅度。幅度。幅度。幅度。例例1 1:从高一(:从高一(1 1)班的一次数学测验抽取一小组)班的一次数学测验抽取一小组成绩如下(保留整数):成绩如下(保留整数):85 90 80 80 85 75 100 计算这组样本数据的计算这组样本数据的极差极差、方差方差和和标准差标准差.例例2 2甲、乙两种水稻试验品种连续甲、乙两种水稻试验品种连续5 5年的平均单位年的平均单位面积产量如下(单位:面积产量如下(单位:t/hmt/hm2 2),试根据这组数据估),试根据这组数据
18、估计哪一种水稻品种的产量比较稳定。计哪一种水稻品种的产量比较稳定。品种品种第第1 1年年第第2 2年年第第3 3年年第第4 4年年第第5 5年年甲甲9.89.89.99.910.110.1101010.210.2乙乙9.49.410.310.310.810.89.79.79.89.81 1、在一次歌手大奖赛上,七位评委为歌手打出的分数、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:如下:9.49.4,8.48.4,9.49.4,9.99.9,9.69.6,9.49.4,9.79.7,去掉一个最高分,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为和一个最低分后,所剩数据的平均值和方差分别为_;2 2、已知数据、已知数据 的方差为的方差为2 2,则求数据,则求数据 的方差、标准差。的方差、标准差。9.5,0.016