《质量管理综合知识53518.docx》由会员分享,可在线阅读,更多相关《质量管理综合知识53518.docx(478页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章概率统计基础知识第一节质量特性性数据的统计计规律一、总体、个个体与样本产品的质量量可以用一个个或多个质量量特性来表示示。这里的特特性可以是定定量的,也可可以是定性的的。例如灯泡泡的寿命,钢钢的成分等都都是定量特性性;而按规范范判定产品为为“合格”或“不合格”,则是一种种定性特征。在质量管理理中,通常研研究一个过程程中生产的全全体产品。在在统计中,将将研究、考察察对象的全体体称为总体。例例如某个工厂厂在一个月内内按照一定材材料及一定工工艺生产的一一批灯泡。总总体是由个体体组成的。在在上例中,这这批灯泡中的的每个特定的的灯泡都是一一个个体。如如果总体中包包含的个体数数不大,而对对产品质量特特
2、性的观测(例如测量)手段不是破破坏性的,工工作量也不大大,那么有可可能对总体中中的每个个体体都进行观测测,以得到每每个个体的质质量特性值。但但是如果总体体中的个体数数N很大,甚甚至是无限的的,或者观测测是破坏性的的或观测的费费用很大,那那么不可能对对总体中的每每个个体都进进行观测。通通常的做法是是从总体中抽抽取一个或多多个个体来进进行观测。抽抽出来的这一一部分个体组组成一个样本本,样本中所所包含的个体体数目称为样样本量。通过过对样本的观观测来对总体体特性进行研研究,是统计计的核心。上述总体、个个体和样本的的概念是统计计的基本概念念,从上面的的叙述中,这这些概念都可可以是具体的的产品。但有有时为
3、了表达达的方便,当当研究产品某某个特定的质质量特性X时时,也常把全全体产品的特特性看做为总总体,而把一一个具体产品品的特性值xx视为个体,把把从总体中抽抽出的由n个个产品的特性性值x1,x2,xn看做为一个个样本。例1.11-1从一一个工厂一个个月内生产的的一批灯泡中中抽取n=88个灯泡,进进行寿命试验验,得到这88个灯泡的使使用寿命为(单位为小时时):325,884,12444,8700,645,11423,11071,9992这这8个灯泡或或相应的使用用寿命即为一一个样本,样样本量n=88。从总体中抽抽取样本的方方法称为抽样样。为使抽取取的样本对总总体有代表性性,样本不能能是有选择的的,最
4、好应是是随机抽取的的,关于这一一点,以后我我们还要详细细解释。二、频数(频率)直方方图及累积频频数(频率)直方图为研究一批批产品的质量量情况,需要要研究它的某某个质量特性性(这里为了了叙述简单起起见,仅讨论论一个质量特特性,有必要要时也可以同同时讨论多个个质量特性)X的变化规规律。为此,从从这批产品(总体)中抽抽取一个样本本(设样本量量为n),对对每个样本产产品进行该特特性的测量(观测)后得得到一组样本本观测值,记记为x1,x2,xn,这便是我我们通常说的的数据。为了研究数数据的变化规规律,需要对对数据进行一一定的加工整整理。直方图图是为研究数数据变化规律律而对数据进进行加工整理理的一种基本本
5、方法。下面面用一个例子子来说明直方方图的概念及及其作法。例1.11-2食品品厂用自动装装罐机生产罐罐头食品,从从一批罐头中中随机抽取1100个进行行称量,获得得罐头的净重重数据如下:为了解这组组数据的分布布规律,对数数据作如下整整理:(1)找出出这组数据中中的最大值xxmax及最小小值xminn,计算它们们的差R=xxmax-xmin,R称称为极值,也也就是这组数数据的取值范范围。在本例例中xmaxx=356,xxmin=3332,从而RR=356-332=224。(2)根据据数据个数,即即样本量n,决决定分组数kk及组距h。一批数据究究竟分多少组组,通常根据据n的多少而而定,不过这这也不是绝
6、对对的,表1.1-1是可可以参考的分分组数。选择k的原原则是要能显显示出数据中中所隐藏的规规律,组数不不能过多,但但也不能太少少。每一组的区区间长度,称称为组距。组组距可以相等等,也可以不不相等。组距距相等的情况况用得比较多多,不过也有有不少情形在在对应于数据据最大及最小小的一个或两两个组,使用用与其他组不不相等的组距距。对于完全全相等的组距距,通常取组组距h为接近近R/k的某某个整数值。在本例中,=100,取取k=9,RR/k=244/9=2.7,故取组组距h=3。(3)确定定组限,即每每个区间的端端点及组中值值。为了避免免一个数据可可能同时属于于两个组,因因此通常将各各组的区间确确定为左开
7、右右闭的:(a0,aa1,(a1,a2,(ak-11,ak通通常要求a00xmax。在等等距分组时,aa1=a0+h,a2=a1+h,ak=ak-1+h,而而每一组的组组中值在本例中取取a0=331.5,则每组组的组限及组组中值见表11.1-2。(4)计算算落在每组的的数据的频数数及频率确定分组后后,统计每组组的频数,即即落在组中的的数据个数nni以及频率ffi=ni/n,列出出每组的频数数、频率表,见见表1.1-2。(5)作频频数频率直方方图在横轴上标标上每个组的的组限,以每每一组的区间间为底,以频频数(频率)为高画一个个矩形,所得得的图形称为为频数(频率率)直方图,如如图1.1-1。到在本
8、本例中频数直直方图及频率率直方图的形形状是完全一一致的。这是是因为分组是是等距的。在分组不完完全等距的情情形,在作频频率直方图时时,应当用每每个组的频率率与组距的比比值fi/hi为高作矩形形。此时以每每个矩形的面面积表示频率率。(6)累积积频数和累积积频率直方图图还有另一种种直方图使用用的是累积频频数和累积频频率。以累积积频率直方图图为例,首先先要计算累积积频率Fi,Fi是将这一组组的频率与前前面所有组的的频率累加,也也即第1组的的F1=f1,第2组的的F2=f1+f2,一般的,FFi=fj。本例中的的各组Fi值也见表11.1-2。如果以每组组的累积频率率Fi为高作矩形形,所得的直直方图称为累
9、累积频率直方方图,本例中中的累积频率率直方图如图图1.1-22所示。可以从直方方图获得数据据的分布规律律,其中包含含数据取值的的范围,以及及它们的集中中位置和分散散程度等信息息。应当引起注注意的是,如如果我们观测测的数据量(即样本量)n很大,而而分组又很细细,那么从频频率直方图及及累积频率直直方图可以分分别得到一根根光滑曲线,关关于这一点我我们将在本章章第三节详细细讨论。三、数据集集中位置的度度量对一组样本本数据,可以以用一些量表表示它们的集集中位置。这这些量中,常常用的有样本本均值、样本本中位数和样样本众数。(一)样本本均值样本均值也也称样本平均均数,记为,它它是样本数据据x1,x2,xn的
10、算术平均均数:例1.11-3轴直直径的一个nn=5的样本本观测值(单单位:cm)为:15.09,155.29,115.15,115.07,115.21,则则样本均值为为:=15.009+15.29+155.15+115.07+15.211)=15.162 对对于n较大的的分组数据,可可利用将每组组的组中组xxi用频率fi加权计算近近似的样本均均值:例1.1-44在例111.2中,1100个罐头头的净量的均均值按分组计计算为:=3330.01十33360.04十十3390.11+3570.01 =345008/1000=345.08样本均值是是使用最为广广泛的反映数数据集中位置置的度量。它它的计
11、算比较较简单,但缺缺点是它受极极端值的影响响比较大。(二)样本本中位数样本中位数数是表示数据据集中位置的的另一种重要要的度量,用用符号Me或或表示。在确确定样本中位位数时,需要要将所有样本本数据按其数数值大小从小小到大重新排排列成以下的的有序样本:x(1),xx(2),x(n)其中xx(1)=xmin,x(n)=xmax分别是是数据的最小小值与最大值值。样本中位数数定义为有序序样本中位置置居于中间的的数值,具体体地说:例1.11-5对例例1.1-33中的5个轴轴直径数据进进行按从小到到大的重新排排序,得到如如下有序样本本:15.077,15.009,15.15,155.21,115.29 这里
12、n=55为奇数,(n+1)/2=3,因因而样本中位位数Me=xx(3)=155.15。注意,在此此例中,中位位数15.115与均值115.1622很接近。与均值相比比,中位数不不受极端值的的影响。因此此在某些场合合,中位数比比均值更能代代表一组数据据的中心位置置。(三)样本本众数样本众数是是样本数据中中出现频率最最高的值,常常记为Modd。例如对例例1.1-22中的罐头净净量,1000个数据中,3344出现的的次数最多,为为12次,因因此Mod=344。样样本众数的主主要缺点是受受数据的随机机性影响比较较大,而且对对大的n,也也很难确定,有有时也不惟一一,此时较多多地采用分组组数据。在本本例中
13、第5组组(343.5,3466.5的频频率为0.330,是所有有组中最高的的,因而该组组的组中值3345可以作作为众数的估估计。注意到到该数与前面面定的3444相差不大。四、数据分分散程度的度度量一组数据总总是有差别的的,对一组质质量特性数据据,大小的差差异反映质量量的波动。也也有一些用来来表示数据内内部差异或分分散程度的量量,其中常用用的有样本极极差、样本方方差、样本标标准差和样本本变异系数。(一)样本本极差样本极差即即是样本数据据中最大值与与最小值之差差,用R表示示。对于有序序样本,极差差R为:R=x(nn)-x(1)(1.1-4)例如在例11.1-3,55个轴直径数数据的极差RR=15.
14、221-15.09=0.12。样本极差只只利用了数据据中两个极端端值,因此它它对数据信息息的利用不够够充分,极差差常用于n不不大的情况。(二)样本本方差与标准准差数据的分散散程度可以用用每个数据xxi离其均值的差差xi-来表示,xxi-称为xi的离差。对对离差不能直直接取平均,因因为离差有正正有负,取平平均会正负相相抵,无法反反映分散的真真实情况。当当然可以先将将其取绝对值值,再进行平平均,这就是是平均绝对差差:但是由于对对绝对值的微微分性质较差差,理论研究究较为困难,因因此平均绝对对差使用并不不广泛。使用用最为广泛的的是用离差平平方来代替离离差的绝对值值,因而数据据的总波动用用离差平方和和来
15、表示,样本方方差定义为离离差平方和除除以n-1,用用s2表示:因为n个离离差的总和为为0,所以对对于n个独立立数据,独立立的离差个数数只有n-11个,称n-1为离差(或离差平方方和)的自由由度,因此样样本方差是用用n-1而不不是用n除离离差平方和。样本方差正正的算术平方方根称为样本本标准差,即即:注意标准差差的量纲与数数据的量纲一一致。在具体计算算时,离差平平方和也可用用以下两个简简便的公式:因此样本方方差计算可用用以下公式:对例1.11-3的轴直直径数据,离离差平方和、样样本方差及样样本标准差的的计算可列表表进行。为计算方便便,可以将数数据减去一个个适当的常数数,这样不影影响样本方差差及标准
16、差的的计算结果。例例如,在本例例中,将每个个数据减去115,即可大大大减少计算算量。在实际际使用中还可可以利用计算算器来计算,特特别是许多科科学计算用的的计算器,都都具有平均数数、方差与标标准差的计算算功能。(三三)样本变异异系数样本标准差差与样本均值值之比称为样样本变异系数数,有时也称称之为相对标标准差,记为为cv:例如对例1.11-2的轴直直径数据,样样本变异系数数cv=0.0901/15.1662=0.00059。第二节概率基础础知识一、事件与与概率(一)随机机现象在一定条件件下,并不总总是出现相同同结果的现象象称为随机现现象。从这个个定义中可看看出,随机现现象有两个特特点:(1)随机机
17、现象的结果果至少有两个个;(2)至于于哪一个出现现,人们事先先并不知道。抛硬币、掷掷骰子是两个个最简单的随随机现象。抛抛一枚硬币,可可能出现正面面,也可能出出现反面,至至于哪一面出出现,事先并并不知道。又又如掷一颗骰骰子,可能出出现1点到66点中某一个个,至于哪一一点出现,事事先也并不知知道。例1.22-1随机机现象的例子子:(1)一天天内进入某超超市的顾客数数;(2)一顾顾客在超市中中购买的商品品数;(3)一顾顾客在超市排排队等候付款款的时间;(4)一颗颗麦穗上长着着的麦粒个数数;(5)新产产品在未来市市场的占有率率;(6)一台台电视机从开开始使用到发发生第一次故故障的时间;(7)加工工机械
18、轴的直直径尺寸;(8)一罐罐午餐肉的重重量。随机现象在在质量管理中中到处可见。认识一个随随机现象首要要的是能罗列列出它的一切切可能发生的的基本结果。这这里的基本结结果是指今后后的抽样单元元,故又称样样本点,随机机现象一切可可能样本点的的全体称为这这个随机现象象的样本空间间,常记为。“抛一枚硬硬币”的样本空间间=正面,反反面;“掷一颗骰骰子”的样本空间间=1,22,3,4,55,6;“一顾客在在超市中购买买商品件数”的样本空间间=0,11,2,;“一台电视视机从开始使使用到发生第第一次故障的的时间”的样本空间间=t:tt0;“测量某物物理量的误差差”的样本空间间=x:-xB,则则:P(A-BB)
19、=P(AA)-P(BB)性质4:事事件A与B的的并的概率为为:P(ABB)=P(AA)+P(BB)-P(AAB)这个性质称称为概率的加加法法则,可可以从图1.1-5中看看出。特别当当A与B不相相容时,由于于P(AB)=P()=0,则则:P(A UU B)=PP(A)+PP(B)性质5:对对于多个互不不相容事件AA1,A2,A3,也有类似似的性质:P(A1A2A3)=P(A1)+P(AA2)+P(AA3)+下面的例子子可帮助我们们理解这些性性质。例1.22-7抛三三枚硬币,至至少一个正面面出现(记为为事件A3)的概率是是多少?解:在抛三三枚硬币的随随机试验中,诸诸如(正,反反,正)这样样的样本点
20、共共有8个。AA3中所含这样样的样本点较较多,但其对对立事件=“抛三枚硬币币,全是反面面”=(反,反反,反),只只含一个样本本点,从等可可能性可知PP()=1/8。再由性性质1,立即即可得:P(A3)=1-P()=1-11/8=7/8=0.8875例1.22-8一批批产品共1000件,其中中5件不合格格品,现从中中随机抽出110件,其中中最多有2件件不合格品的的概率是多少少?解:设A表表示事件“抽出10件件中恰好有ii件不合格品品”,于是所求求事件A=“最多有2件件不合格品”可表示为:A=A0A1 U A2并且A0,A1,A2为三个互不不相容事件,由由性质(5)P(A)=P(A0)+P(A1)+P(AA2)。余下就就是用古典方方法算得:AAi的概率。据据A0的定义,从从100件产产品随机抽出出10件的所所有样本点共共有)个。要要使抽出的110件产品中中有0件不合合格品,即全全是合格品,则则10件必须须从95件合合格品中抽取取,所以:类似地可算算得:于是所求的概率率是:P(A)=0.58337+0.33394+00.07022=0.99933 可见见事件A发生生的概率很接接近于1,发发生的可能性性很大;而它它的对立事件件=“抽10件产产品中至少33件不合格品品”的概率P()=1-PP(A)=11-0.99933=0.