《222-2标准差(2)1.ppt》由会员分享,可在线阅读,更多相关《222-2标准差(2)1.ppt(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.2.2 2.2.2 用样本的数字特征估用样本的数字特征估 计总体的数字特征计总体的数字特征 平均数向我们提供了样本数据的重要平均数向我们提供了样本数据的重要信息信息,但是平均有时也会使我们作出对总体的但是平均有时也会使我们作出对总体的片面判断因为这个平均数掩盖了一些极端片面判断因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的的情况,而这些极端情况显然是不能忽的因此,只有平均数还难以概括样本数据的实因此,只有平均数还难以概括样本数据的实际状态际状态如:有两位射击运动员在一次射击测试中各射靶如:有两位射击运动员在一次射击测试中各射靶10次,次,每次命中的环数如下:每次命中的环数
2、如下:甲:甲:乙:乙:如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩如果看两人本次射击的平均成绩,由于由于 两人射击两人射击 的平均成绩是一样的的平均成绩是一样的.那么两个人的水平就没有那么两个人的水平就没有什么差异吗什么差异吗?45678910环数频率0.10.20.3(甲)456789 100.10.20.30.4环数频率(乙)直观上看直观上看,还是有差异的还是有差异的.如如:甲成绩比较分散甲成绩比较分散,乙成绩乙成绩相对集中相对集中(如图示如图示).因此因此,我们还需要从另外的角度来考察这两组数据我们还需要从另外的角度来考
3、察这两组数据.例如例如:在在作统计图作统计图,表时提到过的极差表时提到过的极差.甲的环数极差甲的环数极差=10-4=6 乙的环数极差乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度它们在一定程度上表明了样本数据的分散程度,与平均数一起与平均数一起,可以给我们可以给我们许多关于样本数据的信息许多关于样本数据的信息.显然显然,极差对极端值非常敏感极差对极端值非常敏感,注意到这一点注意到这一点,我们可我们可以得到一种以得到一种“去掉一个最高分去掉一个最高分,去掉一个最低分去掉一个最低分”的统计策略的统计策略.考察样本数据的分散程度的大小,最常用的统计量是标准差考察样本数据的分散程度
4、的大小,最常用的统计量是标准差标准差是样本平均数的一种平均距离,一般用标准差是样本平均数的一种平均距离,一般用s表示表示所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解:由于上式含有绝对值,运算不太方便,因此,通常由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差改用如下公式来计算标准差一个样本中的个体与平均数之间的距离关系可用下图一个样本中的个体与平均数之间的距离关系可用下图表示表示:考虑一个容量为考虑一个容量为2的样本的样本:显然显然,标准差越大标准差越大,则则a越大越大,数据的离散程度越大数据的离散程度越大;标准差越小标准差越小,数据数据的离散程度
5、越小的离散程度越小.用计算器可算出甲用计算器可算出甲,乙两人的的成绩的标准差乙两人的的成绩的标准差由由 可以知道可以知道,甲的成绩离散程度大甲的成绩离散程度大,乙的成绩离散乙的成绩离散程度小程度小.由此可以估计由此可以估计,乙比甲的射击成绩稳定乙比甲的射击成绩稳定.上面两组数据的离散程度与标准差之间的关系可用上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来图直观地表示出来.45678910a例题例题1:画出下列四组样本数据的直方图画出下列四组样本数据的直方图,说明它们的异同点说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)
6、3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8;解解:四组样本数据的直方图是四组样本数据的直方图是:频率o1 2 3 4 56 7 80.10.20.30.40.50.60.70.80.91.0S=0.00(1)0.10.20.30.40.50.60.70.80.91.01 2 3 4 56 7 8频率o0.10.20.30.40.50.60.70.80.91.0S=1.49(2)频率o1 2 3 4 56 7 8S=0.82频率o1 2 3 456 7 80.10.20.30.40.50.60.70.80.91.0S=2.83四组数据的平均数都是四组数据的平均数
7、都是5.0,标准差分别是标准差分别是0.00,0.82,1.49,2.83.虽然它们有相同的平均数虽然它们有相同的平均数,但是它们有不但是它们有不同的标准差同的标准差,说明数据的分散程度是不一样的说明数据的分散程度是不一样的.标准差还可以用于对样本数据的另外一种解释标准差还可以用于对样本数据的另外一种解释.例如例如,在关于居民月均用水量的例子中在关于居民月均用水量的例子中,平均数平均数标准差标准差s=0.868,所以所以例例2 甲乙两人同时生产内径为甲乙两人同时生产内径为25.40mm的一种零件的一种零件.为了对两人的生产质量进行评比为了对两人的生产质量进行评比,从他们生产的零件从他们生产的零
8、件中各抽出中各抽出20件件,量得其内径尺寸如下量得其内径尺寸如下(单位单位:mm)甲 25.46,25.32,25.45,25.39,25.36 25.34,25.42,25.45,25.38,25.42 25.39,25.43,25.39,25.40,25.44 25.40,25.42,25.35,25.41,25.39乙 25.40,25.43,25.44,25.48,25.48 25.47,25.49,25.49,25.36,25.34 25.33,25.43,25.43,25.32,25.47 25.31,25.32,25.32,25.32,25.48 从生产的零件内径的尺寸看从生产的
9、零件内径的尺寸看,谁生产的质量较高谁生产的质量较高?分析分析:每一个工人生产的所有零件的内径尺寸组成一个总体每一个工人生产的所有零件的内径尺寸组成一个总体,由于零件的生产标准已经给出由于零件的生产标准已经给出(内径内径25.40mm),生产质量可生产质量可以从总体的平均数与标准差两个角度来衡量以从总体的平均数与标准差两个角度来衡量.总体的平均数总体的平均数与内径标准尺寸与内径标准尺寸25.00mm的差异在时质量低的差异在时质量低,差异小时质差异小时质量高量高;当总体的平均数与标准尺寸很接近时当总体的平均数与标准尺寸很接近时,总体的标准差总体的标准差小的时候质量高小的时候质量高,标准差大的时候质
10、量低标准差大的时候质量低.这样比较两人的这样比较两人的生产质量只要比较他们所生产的零件内径尺寸所组成的两生产质量只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可个总体的平均数与标准差的大小即可.但是这两个总体的平但是这两个总体的平均数与标准差都是不知道的均数与标准差都是不知道的,根据用样本估计总体的思想根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样体数据我们可以通过抽样分别获得相应的样体数据,然后比较这两然后比较这两个样本的平均数个样本的平均数,标准差标准差,以此作为两个总体之间的估计值以此作为两个总体之间的估计值.解解:用计算器计算可得用计算器计算可得:
11、从样本平均数看从样本平均数看,甲生产的零件内径比乙生产的更接甲生产的零件内径比乙生产的更接近内径标准近内径标准(25.40mm),但是差异很小但是差异很小;从样本标准差看从样本标准差看,由于由于从上述例子我们可以看到从上述例子我们可以看到,对一名工人生产的零件内径对一名工人生产的零件内径(总体总体)的质的质量判断量判断,与我们抽取的内径与我们抽取的内径(样本数据样本数据)直接相关直接相关.显然显然,我们可以从我们可以从这名工人生产的零件中获取许多样本这名工人生产的零件中获取许多样本(为什么为什么?).这样这样,尽管总体是尽管总体是同一个同一个,但由于样本不同但由于样本不同,相应的样本频率分布与
12、平均数相应的样本频率分布与平均数,标准差等标准差等都会发生改变都会发生改变,这就会影响到我们对总体情况的估计这就会影响到我们对总体情况的估计.如果样本的如果样本的的代表性差的代表性差,那么对总体所作出的估计就会产生偏差那么对总体所作出的估计就会产生偏差;样本没有代样本没有代表性时表性时,对总体作出错误估计的可能性就非常大对总体作出错误估计的可能性就非常大.这也正是我们在这也正是我们在前面讲随机抽样时反复强调样本代表性的理由前面讲随机抽样时反复强调样本代表性的理由.在实际操作中在实际操作中,为为了减少错误的发生了减少错误的发生,条件许可时条件许可时,通常采取适当增加样本容量的方通常采取适当增加样本容量的方法法.当然当然,关键还是要改进抽样方法关键还是要改进抽样方法,提高样本的代表性提高样本的代表性.生产过程中的质量控制图生产过程中的质量控制图正态分布:一些总体的分布密度曲线是由它的平均正态分布:一些总体的分布密度曲线是由它的平均数数 与标准差与标准差 完全确定的,我们把这样的分布完全确定的,我们把这样的分布记作记作 ,称为平均数为,称为平均数为 ,方差为,方差为 的的正态分布正态分布.生产过程中的质量控制图生产过程中的质量控制图