《众数中位数平均数与频率分布直方图的关系教学文案.ppt》由会员分享,可在线阅读,更多相关《众数中位数平均数与频率分布直方图的关系教学文案.ppt(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、众数中位数平均数与频率分布直方图的关系平均数:一组数据的算术平均数,即 x=1、平均数平均数:由数据及频率计算平均数由数据及频率计算平均数,即即x=x1f1+x2f2+xkfk(其中其中fk是是xk的频率。的频率。)2、加权、加权平均数平均数:由数据及其权数和样本容量计算平均数由数据及其权数和样本容量计算平均数,即即x=(x1n1+x2n2+xknk)/n(其中其中nk是是xk的权数的权数,n为样本容量为样本容量,且且n1+n2+nk=n.)3、已知已知xn的平均数为的平均数为x,则则kxn+b的平均数为的平均数为kx+b。平均数平均数:一组数据的算术平均数一组数据的算术平均数,即即 思考题:
2、如何从频率分布直方图中估计思考题:如何从频率分布直方图中估计中位数中位数?中位数左边立方图的小矩形面积为中位数左边立方图的小矩形面积为0.502的小矩形面积之和为:0.5(0.08+0.16+0.30+0.44)=0.490.200.400.100 0.5 1 1.522.53 3.5 4 4.50.500.30频率频率/组距组距月均用水量月均用水量/t0.080.160.440.50.490.010.01/0.5=0.02如图在直线t2.02之前所有小矩形的面积为0.5所以该样本的中位数为2.02练习练习.(广东(广东11变式题变式题1)为了调查某厂工人生产)为了调查某厂工人生产某种产品的能
3、力,随机抽查某种产品的能力,随机抽查了了20位工人某天生位工人某天生产该产品的数量产该产品的数量.产品数量的分组区间为产品数量的分组区间为,分布直方图如图分布直方图如图3,则这,则这20名工人中一天生产名工人中一天生产的中位的中位数数.该产品该产品数量在数量在由此得到频率由此得到频率 3、平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”.是直方图的平衡点是直方图的平衡点.n个样本数据的平均数由个样本数据的平均数由公式公式:X=假设每组数据分别为假设每组数据分别为a1,b1)、)、a2,b2)、)、ak,bk)时)时,且每组数据相应的且每组数据相应的频率分别为频率分别为f1、f2、f
4、k;那么样本的平那么样本的平均数均数(或总体的数学期望或总体的数学期望)由下列公式计算即由下列公式计算即可。可。由频率分布直方图估计样本平由频率分布直方图估计样本平均数均数(或总体数学期望或总体数学期望)公式:公式:X =(a1+b1)/2*f1+(a2+b2)/2*f2+(ak+bk)/2*fk(其中每组数据的频率还可以由频率直方图的面积计算而得,即组距乘以频率其中每组数据的频率还可以由频率直方图的面积计算而得,即组距乘以频率/组距。)组距。)练习练习.(广东(广东11变式题变式题2)为了调查某厂工人生产)为了调查某厂工人生产某种产品的能力,随机抽查某种产品的能力,随机抽查了了20位工人某天
5、生位工人某天生产该产品的数量产该产品的数量.产品数量的分组区间为产品数量的分组区间为,分布直方图如图分布直方图如图3,则这,则这20名工人中一天生产名工人中一天生产的平均的平均数数.该产品该产品数量在数量在由此得到频率由此得到频率总体分布的估计练习:对某电子元件进行寿命追踪调查,情况如下:练习:对某电子元件进行寿命追踪调查,情况如下:寿命寿命个数个数1002002003003004004005005006002030804030(1)列出频率分布表;)列出频率分布表;(2)画出频率分布直方图;)画出频率分布直方图;(3)估计电子元件寿命在)估计电子元件寿命在100h400h以内的概率;以内的概
6、率;(4)估计电子元件寿命在)估计电子元件寿命在400h以上的概率;以上的概率;(5)估计总体的数学期望)估计总体的数学期望.总体分布的估计100200200300300400400500500600寿命寿命合计合计频率频率频数频数累积频率累积频率20308040302000.100.150.400.200.1510.100.250.650.851频率频率/组距组距总体分布的估计思考:思考:从样本数据可知,所求得该样本的众从样本数据可知,所求得该样本的众数、中位数和平均数,这与我们从样本频率数、中位数和平均数,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一分布直方图得出的结论有偏差,
7、你能解释一下原因吗?下原因吗?频率分布直方图损失了一些样本数据,得频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组到的是一个估计值,且所得估值与数据分组有关有关.注注:在只有样本频率分布直方图的情况下,我在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征数,并由此估计总体特征.三、用频率分布直方图估计总体数字的特征的利弊:利弊:总体的各种数值特征都可以由两种途径来估计,总体的各种数值特征都可以由两种途径来估计,直接利用样本数据或由频率分布直方图来估计。直接利用样本数据或由频率分布直方图
8、来估计。两种方法各有利弊;比如:两种方法各有利弊;比如:1、通过频率分布直方图的估计精度低;、通过频率分布直方图的估计精度低;2 2、通过频率分布直方图的估计结果与数据分组、通过频率分布直方图的估计结果与数据分组有关;有关;3 3、在不能得到样本数据,只能得到频率分布直、在不能得到样本数据,只能得到频率分布直方图的情况下,也可以估计总体特征方图的情况下,也可以估计总体特征,而且直方而且直方图比较直观便于形象地进行分析。图比较直观便于形象地进行分析。四、三种数字特征的优缺点四、三种数字特征的优缺点:(1 1)众数体现了样本数据的最大集中点)众数体现了样本数据的最大集中点,但它显然对但它显然对但它
9、显然对但它显然对其他数据信息的忽视使得无法客观地反映总体特征。其他数据信息的忽视使得无法客观地反映总体特征。其他数据信息的忽视使得无法客观地反映总体特征。其他数据信息的忽视使得无法客观地反映总体特征。(2 2)中位数是样本数据所占频率的等分线,它不受)中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,少数几个极端值的影响,这在某些情况下是优点,但它对极端值不敏感有时也会成为缺点但它对极端值不敏感有时也会成为缺点但它对极端值不敏感有时也会成为缺点但它对极端值不敏感有时也会成为缺点.(3 3)由于平均数与每一个样本的数据有关,所以任)由于平均数与每一个样本的数据有
10、关,所以任何一个样本数据的改变都会引起平均数的改变,这何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。是众数、中位数都不具有的性质。但平均数受数据但平均数受数据但平均数受数据但平均数受数据中的极端值的影响较大,使平均数在估计总体时可中的极端值的影响较大,使平均数在估计总体时可中的极端值的影响较大,使平均数在估计总体时可中的极端值的影响较大,使平均数在估计总体时可靠性降低。靠性降低。靠性降低。靠性降低。1 1、在一次歌手大奖赛上,七位评委为歌手打出的分数、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:如下:9.49.4,8.48.4,9.49.4,9.99.9,9.
11、69.6,9.49.4,9.79.7,去掉一个最高分,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为和一个最低分后,所剩数据的平均值和方差分别为_;2 2、已知数据、已知数据 的平均数是的平均数是3 3,方差为,方差为2 2,求,求数据数据 的平均数、方差、标准差?的平均数、方差、标准差?9.5,0.016解:平均数是解:平均数是6,方差是,方差是8,标准差是,标准差是.去掉最高分和最低分合理吗?如果求如果求的平均数、方差、的平均数、方差、标准差?标准差?已知已知ai的平均数的平均数X、方差、方差Y、标准差、标准差Z,则则b+kai的平均数的平均数是是b+kx,方差是方差是k的平方与的平方与Y的乘积的乘积,标准差是标准差是k与与Z的乘积。的乘积。(当然当然Y=Z的平方的平方!)结束语结束语谢谢大家聆听!谢谢大家聆听!18