第二章数据整理及质量管理常用统计方法XXXX新.pptx

上传人:修**** 文档编号:5534816 上传时间:2022-01-10 格式:PPTX 页数:100 大小:450.86KB
返回 下载 相关 举报
第二章数据整理及质量管理常用统计方法XXXX新.pptx_第1页
第1页 / 共100页
第二章数据整理及质量管理常用统计方法XXXX新.pptx_第2页
第2页 / 共100页
点击查看更多>>
资源描述

《第二章数据整理及质量管理常用统计方法XXXX新.pptx》由会员分享,可在线阅读,更多相关《第二章数据整理及质量管理常用统计方法XXXX新.pptx(100页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第二章第二章 数据整理及质量管理常用统计方法数据整理及质量管理常用统计方法l第一节 质量特性及数据整理l第二节质量管理常用的统计方法l第三节过程能力分析第一节第一节 质量特性及数据整理质量特性及数据整理l1.过程和过程控制系统1.1过程可以是一个工段、一道工序或一项操作等,它是将人、设备、材料、方法和环境等输入资源,按一定要求组合起来,并转化为中间产品、半成品、零部件等输出的活动。1.2一个过程增加了反馈系统后就称为过程控制系统。反馈系统是指在过程中和过程输出处增加了信息收集,采用一系列统计方法进行信息的加工处理,发现问题,寻找原因,再反馈给过程的输入,并调整输入中的某些资源,以保证过程的正常

2、运行。如图:图图2.1 过程反馈系统过程控制系统过程反馈系统过程控制系统统计方法人设备材料方法环境资源的组合中间产品半成品零部件信息行动信息输入输出二、质量特性值的分布1、质量特性及质量特性值(数据)、质量特性及质量特性值(数据)数据是质量管理活动的基础,一个具体的产品数据是质量管理活动的基础,一个具体的产品往往需要一系列数据来反映它的质量,如尺寸、往往需要一系列数据来反映它的质量,如尺寸、重量、强度、成分、功率和外观等。这些数据重量、强度、成分、功率和外观等。这些数据反映出产品特定性质,称为质量特性。测定质反映出产品特定性质,称为质量特性。测定质量特性所得的数值叫质量特性值。所以量特性所得的

3、数值叫质量特性值。所以1.1 质量特性质量特性:是指产品(服务)在某方面的:是指产品(服务)在某方面的特定性质,用特定性质,用X表示。如一个具体的尺寸、重表示。如一个具体的尺寸、重量、强度、成分、功率和外观等量、强度、成分、功率和外观等二、质量特性值的分布1、质量特性及质量特性值(数据)、质量特性及质量特性值(数据)数据是质量管理活动的基础,一个具体的产品数据是质量管理活动的基础,一个具体的产品往往需要一系列数据来反映它的质量,如尺寸、往往需要一系列数据来反映它的质量,如尺寸、重量、强度、成分、功率和外观等。这些数据重量、强度、成分、功率和外观等。这些数据反映出产品特定性质,称为质量特性。测定

4、质反映出产品特定性质,称为质量特性。测定质量特性所得的数值叫质量特性值。所以量特性所得的数值叫质量特性值。所以1.1 质量特性质量特性:是指产品(服务)在某方面的:是指产品(服务)在某方面的特定性质,用特定性质,用X表示。如一个具体的尺寸、重表示。如一个具体的尺寸、重量、强度、成分、功率和外观等量、强度、成分、功率和外观等二、质量特性值的分布l1.2 质量特性值质量特性值:是测定质量特性所得的数据,:是测定质量特性所得的数据,即质量特性的观察值,通常是定量的,并简称即质量特性的观察值,通常是定量的,并简称为数据。质量管理中数据有两类数据:为数据。质量管理中数据有两类数据:l2、两类数据、两类数

5、据l2.1 连续数据(计量数据)连续数据(计量数据)l计量数据可以在某一区间取任何值,其取值可计量数据可以在某一区间取任何值,其取值可由某种量具、仪器等测量获得,他们可以在某由某种量具、仪器等测量获得,他们可以在某一区间任意取任何值。如轴的直径、钢的强度一区间任意取任何值。如轴的直径、钢的强度等。等。二、质量特性值的分布l2.2 离散数据(计数数据或属性数据)离散数据(计数数据或属性数据)l计数数据往往只能取非负的整数。如产品不合计数数据往往只能取非负的整数。如产品不合格的个数,铸件上的气泡数等。格的个数,铸件上的气泡数等。l2.3 不同数据的整理不同数据的整理l对不同性质的数据有不同的整理方

6、法。对不同性质的数据有不同的整理方法。l 2.3.1 连续数据的整理连续数据的整理l对计量数据可以计算样本的最大值、平均值、对计量数据可以计算样本的最大值、平均值、中位数、方差、标准差等,并用直方图直观的中位数、方差、标准差等,并用直方图直观的反映计量数据的统计规律性,其分布用概率密反映计量数据的统计规律性,其分布用概率密度函数表示。见度函数表示。见p24页。页。2.3 不同数据的整理2.3.2 离散数据的整理离散数据的整理 对记数数据只能列出频数、频率、分布表并对记数数据只能列出频数、频率、分布表并画出条形图,因此离散数据用分布列表示。见画出条形图,因此离散数据用分布列表示。见p45页。页。

7、三、质量管理中的常见分布 每个产品的质量特性每个产品的质量特性X取什么值是随机的,取什么值是随机的,但一大批产品的质量特性的取值就会呈现出某但一大批产品的质量特性的取值就会呈现出某种规律性。测量了一定数据的产品后,就会形种规律性。测量了一定数据的产品后,就会形成一条曲线,这就形成了质量特性成一条曲线,这就形成了质量特性X的分布。的分布。1、正态分布:记为、正态分布:记为N(,2)2、对数正态分布、对数正态分布:记为记为LN(,2)3、指数分布:记为、指数分布:记为Exp() 以上分布均用于计量数据,其分布图形分别以上分布均用于计量数据,其分布图形分别见见p5, p7, p8,三、质量管理中的常

8、见分布l4、二项分布、二项分布l5、泊松分布、泊松分布l6、超几何分布、超几何分布l以上分布均用于计数数据,其分布图形分别以上分布均用于计数数据,其分布图形分别见见p10, p11, p12,2.3 离散变量的分布l离散变量只取离散的值,比如骰子的点数、离散变量只取离散的值,比如骰子的点数、网站点击数、顾客人数等等。每一种取值网站点击数、顾客人数等等。每一种取值都有某种概率。各种取值点的概率总和应都有某种概率。各种取值点的概率总和应该是该是1。l当然离散变量不不仅仅限于取非负整数值。当然离散变量不不仅仅限于取非负整数值。l一般来说,某离散随机变量的每一个可能一般来说,某离散随机变量的每一个可能

9、取值取值xi都相应于取该值的概率都相应于取该值的概率p(xi),这些,这些概率应该满足关系概率应该满足关系( )1,( )0iiip xp x2.3.1 二项分布l最简单的离散分布应该是基于最简单的离散分布应该是基于可重复可重复的有的有两两结果(比如成功和失败)的相结果(比如成功和失败)的相同同独立独立试验(每次试验成功概率相同)试验(每次试验成功概率相同)的分布,例如抛硬币。的分布,例如抛硬币。l比如用比如用p代表得到硬币正面的概率,代表得到硬币正面的概率,那么那么1p则是得到反面的概率。则是得到反面的概率。l如果知道如果知道p,这个抛硬币的试验的概,这个抛硬币的试验的概率分布也就都知道了。

10、率分布也就都知道了。2.3.1 二项分布l这种有两个可能结果的试验有两个特这种有两个可能结果的试验有两个特点:点:l一是各次试验互相独立,一是各次试验互相独立,l二是每次试验得到一种结果的概率不二是每次试验得到一种结果的概率不变(这里是得到正面的概率总是变(这里是得到正面的概率总是p)。)。l类似于抛硬币的仅有两种结果的重复类似于抛硬币的仅有两种结果的重复独立试验被称为独立试验被称为Bernoulli试验试验(Bernoulli trials)。)。2.3.1 二项分布l下面试验可看成为下面试验可看成为Bernoulli试验:试验:l每一个进入某商场的顾客是否购买某每一个进入某商场的顾客是否购

11、买某商品商品l每个被调查者是否认可某种产品每个被调查者是否认可某种产品l每一个新出婴儿的性别。每一个新出婴儿的性别。l根据这种简单试验的分布,可以得到根据这种简单试验的分布,可以得到基于这个试验的更加复杂事件的概率。基于这个试验的更加复杂事件的概率。2.3.1 二项分布l为了方便,人们通常称为了方便,人们通常称Bernoulli试验试验的两种结果为的两种结果为“成功成功”和和“失败失败”。l和和Bernoulli试验相关的最常见的问题试验相关的最常见的问题是:是:如果进行如果进行n次次Bernoulli试验,每试验,每次成功的概率为次成功的概率为p,那么成功,那么成功k次的概次的概率是多少?率

12、是多少?l这个概率的分布就是所谓的二项分布这个概率的分布就是所谓的二项分布(binomial distribution)。2.3.1 二项分布l这个分布有两个参数,一个是试验次这个分布有两个参数,一个是试验次数数n,另一个是每次试验成功的概率,另一个是每次试验成功的概率p。l基于此,二项分布用符号基于此,二项分布用符号B(n,p)或或Bin(n,p)表示。表示。l由于由于n和和p可以根据实际情况取各种不可以根据实际情况取各种不同的值,因此二项分布是一族分布,同的值,因此二项分布是一族分布,l族内的分布以这两个参数来区分。族内的分布以这两个参数来区分。2.3.1 二项分布l二项分布的概率通常用二

13、项分布表来二项分布的概率通常用二项分布表来查出。但一般统计软件可以很容易得查出。但一般统计软件可以很容易得到这个概率。到这个概率。l在目前统计软件发达的情况下,涉及在目前统计软件发达的情况下,涉及的二项分布一般都自动处理了;在处的二项分布一般都自动处理了;在处理实际问题中很少会遇到直接计算二理实际问题中很少会遇到直接计算二项分布概率的情况。项分布概率的情况。2.3.1 二项分布l但这里还是给出其一般公式。下面但这里还是给出其一般公式。下面p(k)代表在代表在n次次Bernoulli试验中成功试验中成功的次数的概率,的次数的概率,p为每次试验成功的为每次试验成功的概率。有概率。有( )(1),0

14、,1,.,kn knp kppknk 这里!()!nnkk nk 为二项式系数,或记为knC0.000.200.400.60概率概率p= 0 .1p= 0 .1p= 0 .2p= 0 .2p= 0 .3p= 0 .3p= 0 .4p= 0 .4p= 0 .5p= 0 .5p= 0 .6p= 0 .6p= 0 .7p= 0 .7p= 0 .8p= 0 .8p= 0 .9p= 0 .90.000.200.400.60概率概率012345值0.000.200.400.60概率概率012345值012345值图图3.1 九个二项分布九个二项分布B(5,p) (p0.1到到0.9)的概率分布图的概率分布

15、图2.3.3 Poisson分布l另一个常用离散分布是另一个常用离散分布是Poisson分布分布(翻译成(翻译成“泊松分布泊松分布”或或“普阿松分普阿松分布布”)。)。l它可以认为是衡量某种事件在一定期它可以认为是衡量某种事件在一定期间出现的数目的概率。间出现的数目的概率。l比如说在一定时间内顾客的人数、打比如说在一定时间内顾客的人数、打入电话总机电话的个数、放射性物质入电话总机电话的个数、放射性物质放射出来并到达某区域的粒子数等等。放射出来并到达某区域的粒子数等等。2.3.3 Poisson分布l在不同条件下,同样事件在单位时间在不同条件下,同样事件在单位时间中出现同等数目的概率不尽相同。中

16、出现同等数目的概率不尽相同。l比如中午和晚上某商店在比如中午和晚上某商店在10分钟内出分钟内出现现5个顾客的概率就不一定相同。个顾客的概率就不一定相同。l因此,因此,Poisson分布也是一个分布族。分布也是一个分布族。族中不同成员的区别在于事件出现数族中不同成员的区别在于事件出现数目的均值目的均值l l不一样。不一样。2.3.3 Poisson分布l参数为参数为l l的的Poisson分布变量的概率分分布变量的概率分布为(布为(p(k)表示表示Poisson变量等于变量等于k的的概率)概率)( ),0,1,2,.!kP kekkllk20151050概率.3.2.10.0Poisson 分布

17、P(10)P(6)P(3)参数为3、6、10的Poisson分布(只标出了20之内的部分)这里点间的连线没有意义,仅仅为读者容易识别而画,因为Poisson变量仅取非负整数值2.3.4 超几何分布l假定有一批假定有一批500个产品,而其中有个产品,而其中有5个个次品。假定该产品的质量检查采取随次品。假定该产品的质量检查采取随机抽取机抽取20个产品进行检查。如果抽到个产品进行检查。如果抽到的的20个产品中含有个产品中含有2个或更多不合格个或更多不合格产品,则整个产品,则整个500个产品将会被退回。个产品将会被退回。l这时,人们想知道,该批产品被退回这时,人们想知道,该批产品被退回的概率是多少?这

18、种概率就满足的概率是多少?这种概率就满足超几超几何 分 布 (何 分 布 ( h y p e r g e o m e t r i c distribution)。2.3.4 超几何分布l这是一种所谓的这是一种所谓的“不放回抽样不放回抽样”,也,也就是说,一次抽取若干物品,每检查就是说,一次抽取若干物品,每检查一个之后并不放回;一个之后并不放回;l超几何分布族的成员被三个参数决定,超几何分布族的成员被三个参数决定,这里相应于产品总个数这里相应于产品总个数n,其中不合,其中不合格产品数目格产品数目m,不放回抽样的数目,不放回抽样的数目t;而样本中有而样本中有x个不合格产品的概率为个不合格产品的概率

19、为( ),0,1,.,mnmxtxp xxtnt 2.4 连续变量的分布l取连续值的变量,如高度、长度、重取连续值的变量,如高度、长度、重量、时间、距离等等;它们被称为连量、时间、距离等等;它们被称为连续变量续变量(continuous variable)。l换言之,一个随机变量如果能够在一换言之,一个随机变量如果能够在一区间(无论这个区间多么小)内取任区间(无论这个区间多么小)内取任何值,则该变量称为在此区间内是连何值,则该变量称为在此区间内是连续的,其分布称为连续型概率分布。续的,其分布称为连续型概率分布。l它们的概率分布很难准确地用离散变它们的概率分布很难准确地用离散变量概率的条形图表示

20、。量概率的条形图表示。2.4 连续变量的分布l想象连续变量观测值的直方图;如果其纵想象连续变量观测值的直方图;如果其纵坐标为相对频数,那么所有这些矩形条的坐标为相对频数,那么所有这些矩形条的高度和为高度和为1;完全可以重新设置量纲,使得;完全可以重新设置量纲,使得这些矩形条的面积和为这些矩形条的面积和为1。l不断增加观测值及直方图的矩形条的数目,不断增加观测值及直方图的矩形条的数目,直方图就会越来越像一条光滑曲线,其下直方图就会越来越像一条光滑曲线,其下面的面积和为面的面积和为1。l该曲线即所谓该曲线即所谓概率密度函数概率密度函数(probability density function,pd

21、f),简称密度函数或,简称密度函数或密度。下图为这样形成的密度曲线。密度。下图为这样形成的密度曲线。(1)(2)(3)(4)-2020.00.10.20.30.4逐渐增加矩形条数目的直方图和一个逐渐增加矩形条数目的直方图和一个形状类似的密度曲线。形状类似的密度曲线。 2.4 连续变量的分布l连续变量落入某个区间的概率就是概率密连续变量落入某个区间的概率就是概率密度函数的曲线在这个区间上所覆盖的面积;度函数的曲线在这个区间上所覆盖的面积;因此,理论上,这个概率就是密度函数在因此,理论上,这个概率就是密度函数在这个区间上的积分。这个区间上的积分。l对于连续变量,取某个特定值的概率都是对于连续变量,

22、取某个特定值的概率都是零,而只有变量取值于某个(或若干个)零,而只有变量取值于某个(或若干个)区间的概率才可能大于区间的概率才可能大于0。l连续变量密度函数曲线(这里用连续变量密度函数曲线(这里用f表示)下表示)下面覆盖的总面积为面覆盖的总面积为1,即,即( )1f x dx2.4.1 正态分布l在北京市场上的精制盐很多是一公斤袋装,在北京市场上的精制盐很多是一公斤袋装,上面标有上面标有“净含量净含量1kg”的字样。但当你的字样。但当你用稍微精确一些的天平称那些袋装盐的重用稍微精确一些的天平称那些袋装盐的重量时,会发现有些可能会重些,有些可能量时,会发现有些可能会重些,有些可能会轻些;但都是在

23、会轻些;但都是在1kg左右。多数离左右。多数离1kg不不远,离远,离1kg越近就越可能出现,离越近就越可能出现,离1kg越远越远就越不可能。就越不可能。l一般认为这种重量分布近似地服从最常用一般认为这种重量分布近似地服从最常用的的正态分布正态分布(normal distribution,又叫,又叫高高斯分布,斯分布,Gaussian distribution)。2.4.1 正态分布l近似地服从正态分布的变量很常近似地服从正态分布的变量很常见,象测量误差、商品的重量或见,象测量误差、商品的重量或尺寸、某年龄人群的身高和体重尺寸、某年龄人群的身高和体重等等。等等。l在一定条件下,许多不是正态分在一

24、定条件下,许多不是正态分布的样本均值在样本量很大时,布的样本均值在样本量很大时,也可用正态分布来近似。也可用正态分布来近似。2.4.1 正态分布l正态分布的密度曲线是一个对称的钟正态分布的密度曲线是一个对称的钟型曲线(最高点在均值处)。正态分型曲线(最高点在均值处)。正态分布也是一族分布,各种正态分布根据布也是一族分布,各种正态分布根据它们的均值和标准差不同而有区别。它们的均值和标准差不同而有区别。l一个正态分布用一个正态分布用N(m m,s s)表示;其中表示;其中m m为 均 值 , 而为 均 值 , 而s s为标准差。 也 常 用为标准差。 也 常 用N(m m,s s2 2)来表示,这

25、里来表示,这里s s2 2为方差(标准为方差(标准差的平方)。差的平方)。2.4.1 正态分布l标准差为标准差为1的正态分布的正态分布N(0, 1)称为称为标准正态标准正态分布分布(standard normal distribution)。l标准正态分布的密度函数用标准正态分布的密度函数用f f(x)表示。表示。l任何具有正态分布任何具有正态分布N(m m,s s)的随机变量的随机变量X都可都可以用简单的变换(减去其均值以用简单的变换(减去其均值m m,再除以,再除以标准差标准差s s):):Z=(X-m)/sm)/s,而成为标准正态而成为标准正态随机变量。这种变换和标准得分的意义类随机变量

26、。这种变换和标准得分的意义类似。似。-4-20240.00.20.40.60.8N(0,1)N(-2,0.5)两条正态分布的密度曲线。左边是两条正态分布的密度曲线。左边是N(-2,0.5)分布,右边是分布,右边是N(0, 1)分布分布 2.4.1 正态分布l当然,和所有连续变量一样,正态变量落在某当然,和所有连续变量一样,正态变量落在某个区间的概率就等于在这个区间上,密度曲线个区间的概率就等于在这个区间上,密度曲线下面的面积。下面的面积。l比如,标准正态分布变量落在区间比如,标准正态分布变量落在区间(0.51,1.57)中中的概率,就是在标准正态密度曲线下面在的概率,就是在标准正态密度曲线下面

27、在0.51和和1.57之间的面积。之间的面积。l很容易得到这个面积等于很容易得到这个面积等于0.24682;也就是说,;也就是说,标准正态变量在区间标准正态变量在区间(0.51,1.57)中的概率等于中的概率等于0.24682。如果密度函数为。如果密度函数为f f(x),那么这个面积为,那么这个面积为积分积分1.570.51( )0.24682x dxf-4-3-2-10123400 . 0 50 . 10 . 1 50 . 20 . 2 50 . 30 . 3 50 . 4P ro b a b ilit y B e t w e e n L im it s is 0 . 2 4 6 8 2De

28、nsityC rit ic a l V a lu e标准正态变量在区间标准正态变量在区间(0.51, 1.57)中的中的概率概率2.4.1 正态分布l我们有必要引进总体的下侧分位数、上侧我们有必要引进总体的下侧分位数、上侧分位数以及相应的尾概率的概念。分位数以及相应的尾概率的概念。l对于连续型随机变量对于连续型随机变量X,a a下侧分位数(又下侧分位数(又称为称为a a分位数,分位数,a a-quantile)定义为数)定义为数xa a,它满足关系它满足关系()P Xxaa这里的这里的a a又又称为下(左)侧尾概率称为下(左)侧尾概率(lower/left tail probability)2

29、.4.1 正态分布l而而a a上侧分位数(又称上侧分位数(又称a a上上分位数,分位数,a a-upper quantile)定义为数)定义为数xa a,它,它满足关系满足关系()P Xxaa这里的这里的a a也也称为上(右)侧尾概率称为上(右)侧尾概率(upper/right tail probability)。)。2.4.1 正态分布l对于非连续型的分布,分位数的对于非连续型的分布,分位数的定义稍微复杂一些;定义稍微复杂一些;l显然,对于连续分布,显然,对于连续分布,a a上侧分位上侧分位数等于数等于(1a)a)下侧分位数,而下侧分位数,而(1a)a)下侧分位数等于下侧分位数等于a a上侧

30、分位数。上侧分位数。2.4.1 正态分布l通常通常用用za a表示标准正态分布的表示标准正态分布的a a上上侧分位数,即对于标准正态分布侧分位数,即对于标准正态分布变量变量Z,有,有P(Zza a)=a a。l图图4.64.6表示了表示了0.050.05上侧分位数上侧分位数za a= z0 . 0 50 . 0 5及 相 应 的 尾 概 率及 相 应 的 尾 概 率(a0.05a0.05)。有些书用符号)。有些书用符号z1 1a a而不是而不是za a;因此在看参考文献时;因此在看参考文献时要注意符号的定义。要注意符号的定义。-3-2-1012300.050.10.150.20.250.30.

31、350.4z valueDensity of N(0,1)Tail Probability for N(0,1)z0.05=1.645P(zz0.05)=a=0.05P(zza a)=a a的示意的示意图图2.4.2 c2-分布l一个由正态变量导出的分布是一个由正态变量导出的分布是c c2-分分布布(chi-square distribution,也翻译为,也翻译为卡方分布卡方分布)。该分布在一些检验中会。该分布在一些检验中会用到。用到。ln个独立正态变量平方和称为有个独立正态变量平方和称为有n个自个自由度的由度的c c2-分布分布,记为记为c c2(n)。c c2-分布为分布为一族分布一族分

32、布, 成员由自由度区分。成员由自由度区分。l由于由于c c2-分布变量为正态变量的平方分布变量为正态变量的平方和,它不会取负值。和,它不会取负值。02468100.00.10.20.30.40.5c2(2)c2(3)c2(5)自由度为自由度为2、3、5的的c c2-分布密度曲线图分布密度曲线图2.4.3 t-分布l正态变量的样本均值也是正态变量,正态变量的样本均值也是正态变量,能利用减去其均值再除以其能利用减去其均值再除以其(总体总体)标标准差来得到标准正态变量。准差来得到标准正态变量。l但用样本标准差来代替未知的总体标但用样本标准差来代替未知的总体标准差时,得到的结果分布就不再是标准差时,得

33、到的结果分布就不再是标准正态分布了。它的密度曲线看上去准正态分布了。它的密度曲线看上去有些象标准正态分布,但是中间瘦一有些象标准正态分布,但是中间瘦一些,而且尾巴长一些。这种分布称为些,而且尾巴长一些。这种分布称为t-分布分布(t-distribution,或或学生分布,学生分布,Students t)。2.4.3 t-分布l不同的样本量通过标准化所产生的不同的样本量通过标准化所产生的t分布也不同分布也不同, 这样就形成一族分布。这样就形成一族分布。lt分布族中的成员是以自由度来区分分布族中的成员是以自由度来区分的。这里的自由度等于样本量减去的。这里的自由度等于样本量减去1(如果样本量为(如果

34、样本量为n,刚才定义的,刚才定义的t分布分布的自由度为的自由度为n-1)。)。l由于产生由于产生t分布的方式很多,简单说分布的方式很多,简单说自由度就是样本量减自由度就是样本量减1是不准确的。是不准确的。自由度甚至不一定是整数。自由度甚至不一定是整数。-4-20240.00.10.20.30.4N(0,1)t(1)标准正态分布和标准正态分布和t(1)分布的密度图分布的密度图 2.4.3 t-分布l通常通常用用ta a表示表示t分布相应于右侧尾分布相应于右侧尾概率概率a a的的t变量的变量的a a上侧分位数,即上侧分位数,即对于对于t分布变量分布变量T,有,有P(Tta a)=a a。在突出自由

35、度时,也用在突出自由度时,也用tn,a a,也,也有用有用t1 1a a或或tn,1 1a a表示的。表示的。l图图4.94.9表示了自由度为表示了自由度为2的的t(2)分布分布右边的尾概率(右边的尾概率(a0.05a0.05)。-5-4-3-2-101234500.050.10.150.20.250.30.350.4t valueDensity of t(2)Tail Probability for t(2)t0.05=2.92P(tt0.05)=a=0.05P(tta a)=a a的示意图的示意图2.4.4 F-分布lF-分布变量为两个分布变量为两个c c2-分布变量分布变量(在除以它们各

36、自自由度之后)(在除以它们各自自由度之后)的比;的比;l而两个而两个c c2-分布的自由度则为分布的自由度则为F-分分布的自由度,因此,布的自由度,因此,F-分布有两分布有两个自由度;第一个自由度等于在个自由度;第一个自由度等于在分子上的分子上的c c2-分布的自由度,第二分布的自由度,第二个自由度等于在分母的个自由度等于在分母的c c2-分布的分布的自由度。自由度。024680.00.20.40.60.81.0F(50,20)F(3,20)自由度为(自由度为(3,20)和()和(50,20)的的F-分布密度曲线图分布密度曲线图 2.5 累积分布函数l在前面离散分布的情况可以用在前面离散分布的

37、情况可以用p(x)表示该变量取值表示该变量取值x的概率,如果用的概率,如果用大写英文字母大写英文字母X表示相应的随机变表示相应的随机变量,那么概率量,那么概率P(X=x)= p(x)。而。而()( )( )( )()(1)nk mP mXnp kp mp nP XnP Xm2.5 累积分布函数l在连续分布的情况,可以用在连续分布的情况,可以用f(x)表表示密度函数,则概率(注意在连示密度函数,则概率(注意在连续分布中,某单独点的概率为续分布中,某单独点的概率为0,因此下式中的不等式中的等式可因此下式中的不等式中的等式可以去掉)以去掉)()( )()()baP aXbf x dxP XbP Xa

38、2.5 累积分布函数l为了计算概率,只知道密度函数对为了计算概率,只知道密度函数对于查表或应用软件来得到已知分布于查表或应用软件来得到已知分布的概率是不方便的,最好能够知道的概率是不方便的,最好能够知道随机变量小于或等于某值的概率。随机变量小于或等于某值的概率。在上面公式中,如果知道了下面的在上面公式中,如果知道了下面的值就可以计算所需的概率了(统计值就可以计算所需的概率了(统计书中的多数分布表的概率是以下面书中的多数分布表的概率是以下面累积分布函数累积分布函数的形式给出的):的形式给出的):(),(),(),()P XmP XnP XaP Xb四、分布的特征数l1、均值与方差的运算性质、均值

39、与方差的运算性质P13l2、矩、矩P14l3、变异系数、变异系数l4、分位数、分位数第二节 总体、样本与统计量1、总体与样本、总体与样本 为了研究产品的质量情况,就要研究其质量特为了研究产品的质量情况,就要研究其质量特性性X的分布,即要研究总体的取值规律,为此需的分布,即要研究总体的取值规律,为此需要从产品总体中抽出若干个体构成要从产品总体中抽出若干个体构成样本样本n (从总从总体中抽出部分个体构成的集合体中抽出部分个体构成的集合)。 测量并获得样本的质量特性值,记为测量并获得样本的质量特性值,记为x1,x2,.,xn ,这是样本数据,即,这是样本数据,即样本观察值样本观察值。2、 频数频率表

40、与直方图2.1 直方图直方图适用于对大量计量值进行整理加工,找出其统适用于对大量计量值进行整理加工,找出其统计规律,即分析数据的分布形态,以便对其总计规律,即分析数据的分布形态,以便对其总体的分布特征进行分析的方法。体的分布特征进行分析的方法。2.1.1 形状有(形状有(1)对称型(正态型)()对称型(正态型)(2)偏态)偏态型(左偏态、右偏态)(型(左偏态、右偏态)(3)孤岛型()孤岛型(4)锯齿)锯齿型(型(5)平顶型()平顶型(6)双峰型。)双峰型。2、 频数频率表与直方图2.1.2 作图方法作图方法将质量特性值排序(按生产时间或作业顺序)将质量特性值排序(按生产时间或作业顺序)找出最大

41、值找出最大值max和最小值和最小值min求出极值求出极值R=max-min分组(组数、组距)分组(组数、组距)记录各组数据,整理成频数分布表记录各组数据,整理成频数分布表计算均值计算均值计算标准偏差计算标准偏差S画直方图(在画直方图(在mimitab中实现)中实现) 返回2、 频数频率表与直方图2.2 正态概率图正态概率图P20-23正态概率纸的横轴代表等间隔刻度(正态概率纸的横轴代表等间隔刻度(x),纵坐),纵坐标正态累计概率刻度(标正态累计概率刻度(F(x)。)。正态分布的分布函数在正态概率纸上呈上升直正态分布的分布函数在正态概率纸上呈上升直线状;而非正态分布的分布函数在正态概率纸线状;而

42、非正态分布的分布函数在正态概率纸上呈曲线状。上呈曲线状。3、 统计量3.1 统计量的定义统计量的定义P23设设xi是来自某总体的样本,不含未知参数的是来自某总体的样本,不含未知参数的样本的函数样本的函数T=T(xi)称为称为统计量统计量,如样本均值、,如样本均值、样本极差和样本方差等。统计量的分布称为样本极差和样本方差等。统计量的分布称为抽抽样分布样分布。4、抽样分布、抽样分布p24-284.1 样本均值的分布:无论总体是正态还是非正样本均值的分布:无论总体是正态还是非正态分布,只要总体方差态分布,只要总体方差2存在,在大样本条件存在,在大样本条件下,样本均值的分布都渐进为正态分布下,样本均值

43、的分布都渐进为正态分布N(, 2/n)。第二节第二节 质量管理常用统计方法质量管理常用统计方法 2. 1统计分析表法 2. 2排列图(pareto图) 2.3因果图(鱼刺图) 2. 4直方图 2. 5分层法 2. 1统计分析表法统计分析表法统计分析表法也叫调查表,是用于收集数据的规范化表格,即把产品可能出现的情况及其分类预先列成统计调查表,则检查产品时只需在相应分类中进行统计,并可从调查表中进行粗略的整理和简单的原因分析,为下一步的统计分析与判断质量状况创造良好条件。在设计调查表时应注意便于工人记录,把文字部分尽可能列入调查表中,工人只须简单地描点或打勾,以不影响操作为宜。根据使用不同,常调查

44、表有以下几种: 2.1.1不良品检查表 2.1.2缺陷位置调查表 2.1.3成品质量调查表 2.1统计分析表法统计分析表法2.1.1不良品检查表不良品指产品生产过程中不符合图纸、工艺规程和技术标准的不合格和缺陷品的总称,它包括废品、返修品、回用品和退赔品。2.1.1.1不良品统计管理记录卡:记录前应明确检验内容和抽查间隔。由操作者、检查员、班长共同执行抽样的标准和规定。表表31 31 不良品统计管理记录卡不良品统计管理记录卡 车间班组,零件号 零件名称 检验内容 间隔日期 首检偏号自检结果不良 品 专、巡检时间内容尺寸现象原因时间抽查数不良品树不良品现象印记备注 首检内容代号 不良品原因分类A

45、:开始工作 D:检修机床后B:更换刀具后 E:检修夹具后C:调整刀具后a操作不慎 d工艺b机床原因 e材料c刀具影响 f其他 2.1.1.2.2 不良项目调查表不良项目调查表为了调查生产过程中出现了哪些不良品以及各种不良品的比例。可采用不良项目调查表,见表32所示 表32不良项目调查表 检查员: 项目数量 交 验 数 合 格 数 不良品 不良品类型废品数次品数返修品数废品类型次品类型返修品类型不良品率(%)日期 2.1.1.3 .3 不良原因调查表不良原因调查表如果不良损失的责任工序影响原因比较清楚,可以利用调查表进一步查明不良原因。表33为不良原因调查表。 33 某瓷厂瓷检报告报告日期 年月

46、 日品号送检总数合格品合格率 瓷件损失原因分析废品数榨泥 成型上釉 装出窑 烧窑铁点杂质开裂尺寸不合变形釉损碰损釉损表面缺陷碰损炸裂气泡生烧2.1.2 缺陷位置调查表缺陷位置调查表在很多中产品中都会存在“疵点”,“外伤”这类外观缺陷,一般采用缺陷位置调查表较好。这种调查表多是画产品示意图。每当发生缺陷时,将其发生位置标记在图上。此方法是工序质量分析中常用的方法,掌握缺陷发生处的规律,可进一步分析为什么缺陷集中在某一区域,从而追寻原因,采取对策,能更好的解决出现的质量问题。2.1.3成品质量调查表成品质量调查表成品质量调查项目繁多,为了便于记录整理,采用成品质量检查表的方法。返回 2.2排列图(

47、排列图(pareto图)图) 2.2.1概念:排列图又叫巴累托图,是由意大利经济学家巴累托提出的,他在发现美国财富分布状况时发现,少数人拥有大多数财少量富,而绝大多数人却占有财富,即所谓“关键的少数,次要的多数”的关系。后来美国质量管理专家朱兰(J.M.Juran)将其引入质量管理中,成为一种质量管理的重要工具。 2.2排列图(排列图(pareto图)图)l 2.2.2作用:排列图主要是用来在众多影响产品质量的各种因素中寻找主要因素,故其全称应为“主次因素排列图”,认为产品质量的多数问题是由少数原因引起的。l 2.2.3作图步骤 (1)将不合格产品按不同原因或类别进行分类;(2)按分类 项目进

48、行统计,计算频数或频率;(3)计算累计频率;(4)在坐标纸上按频数大小作直方图,频数大的在前,小的在后;(5)按累计频率作排列曲线;(6)记载排列图标题及数据简历。 2.2排列图(排列图(pareto图)图)例1.8(29页) 对某产品检查了7批,将每批检查情况汇总成表1.10表1.10 不合格原因调查表批号检查数不合格品数不合格原因操作设备工具工艺材料其它14573167603002945088368161401434895712511214010450761293000055012171311110649082396510274839196013000 2.2排列图(排列图(pareto图

49、)图) 2.2.4排列图分析 通常将影响产品质量的问题或原因分为三大类:l A类:为关键性问题或主要原因,累计百分比在080%。l B类:为次要问题或次要因素,累计百分比在 8095%。l C类:为更次要因素,累计百分比在95 100%。 返回 2.3因果图(鱼刺图)因果图(鱼刺图)2.3.1作用:因果图是用来分析影响产品质量各种原因的一种有效方法,对影响产品质量的一些较为重要的因素加以分析和分类,并在同一张图上把他们的关系用箭头表示出来,以对因果作明确系统的处理,又叫鱼刺图或特性要因图。2.3因果图(鱼刺图)因果图(鱼刺图)2.3.2作图方法(1)确定待分析的质量问题,写在右侧方框内,画出主

50、干箭头指向右端。(2)确定影响该质量的主要原因,并分类写在大枝上。(一般从人、设备、材料、方法和环境五方面考虑)(3)将各分类项目分别展开,画中枝,并写上原因。2.3因果图(鱼刺图)因果图(鱼刺图)2.3.2作图方法(4)将原因再展开,分别画小枝。(5)检查是否有遗漏,找出主要原因,写上标题等。质量问题(结果)大原因中原因小原因2.3因果图(鱼刺图)因果图(鱼刺图)l例1.9(32页)某厂生产的曲拐开档大、弯头小,分析原因,画出因果图。见图1.16开档大弯头小工人机器环境材料方法新工人多思想不集中没有自检压板压不紧压板夹紧力不足压紧头有时压不紧漏油超负荷定位销断夹具厚薄不一140与150混错弯

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁