SPC-基本统计.pptx

上传人:修**** 文档编号:5749883 上传时间:2022-01-17 格式:PPTX 页数:65 大小:546.51KB
返回 下载 相关 举报
SPC-基本统计.pptx_第1页
第1页 / 共65页
SPC-基本统计.pptx_第2页
第2页 / 共65页
点击查看更多>>
资源描述

《SPC-基本统计.pptx》由会员分享,可在线阅读,更多相关《SPC-基本统计.pptx(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、Basic Statistic基本统计学基本统计学1/17/2022数据的分类数据的分类1/17/2022什么是数据什么是数据数据是来自观察的,由一个过程所搜集得来的数据可让我们描绘过程,了解过程,改善过程甚至控制过程.Data 数据驱动决策和行动数据驱动决策和行动1/17/2022数据在过程改善中的重要性数据在过程改善中的重要性 In God we trust我们只相信上帝我们只相信上帝所有其他人请拿出数据来所有其他人请拿出数据来1/17/2022两种主要数据类型两种主要数据类型 (类项数据)(测量数据)(名目型)(连续型)(顺序型)(计数型)离散数据离散数据变量数据变量数据1/17/202

2、2练习一练习一 请标出下列数据的类型,A代表计数型数据,V代表计量型数据1) 顾客平均消费,电话待机时间2) 产品是否合格3) 职员-Tom, Nancy, Howard.4) 4) 支出与预算相符5) 输入支出费用的时间1/17/2022答案答案 1) 顾客平均消费,电话待机时间 v 2) 产品是否合格 A 3) 职员- Tom, Nancy, Howard. A 4) 4) 支出与预算相符 A5) 输入支出费用的时间 v数据类型 (V or A)1/17/2022小组讨论(练习二)小组讨论(练习二) 计量型数据 计量型数据的益处 ? 计量型数据的缺点 ?计数型数据计数型数据的益处 ?计数型

3、数据的缺点 ?1/17/2022小组讨论小组讨论 答案计量型数据答案计量型数据u 益处益处 :1.能够为使用相对小范围抽样的过程提供详细的信息2.适用于低缺陷率3. 能够预估发展趋势和情况u 缺点缺点 :1.通常较难得到数据2.分析更为复杂1/17/2022小组讨论小组讨论 答案计量型数据答案计量型数据u 益处益处 :1. 容易得到数据,并且计算方法简单2. 数据容易理解3. 数据随时可得u 缺点缺点 :1.无法显示缺陷怎样发生及过程如何变化2.不适合低缺陷率(需要大量的抽样)3.不能预测发展趋势和情况1/17/2022数据类型比较数据类型比较计量型数据计数型数据连续数据计数数据通常为正态分布

4、通常为二项式分布或泊松分布实际数值合格/不合格实际定义严谨数据定义较差需少量抽样需大量抽样1/17/2022 知识水平知识水平1. 没有数据,也没有经验 只有观点2. 没有数据 只有经验3. 收集了数据 - 但只是看数字有多少4. 分组的数据 - 图表5. 描述性统计数据 中数、标准差等等6. 推理性统计 预测过程绩效:能力分析,回归和实验计划法 1/17/2022转化计数型数据转化计数型数据 如可以,将计数型数据转换为计量型数据能增加它的功能。计数型数据计量型数据转换为1/17/2022Variable Data计量型数据计量型数据1/17/2022计量型数据计量型数据 学习目的学习目的完成

5、此阶段学习后, 学员能够 利用数据的分布形状,中央趋势和变异大小进行特性化如果数据是正态分布的,计算z数值,利用Z数值表确定超出某一数值的比例1/17/2022离散数据与连续数据离散数据与连续数据连续数据的优点:连续数据的优点: 离散离散=稀少的信息稀少的信息 连续连续=丰富的信息丰富的信息1/17/2022统计学基本术语统计学基本术语lPopulation 总体总体 想要测量对象的全部lParameter 参数参数 用总体的所有数据计算出的数值(如均值, 标准差), 称为总体的参数 x参数总体平均值总体标准差总体1/17/2022统计学基本术语统计学基本术语lSample 样本样本 从总体抽

6、出的部分数据lStatistics 统计量统计量 用样本的所有数据计算出的数值(如均值, 标准差), 称为样本的统计量x统计量样本平均值样本标准差s总体样本1/17/2022统计学基本术语统计学基本术语lPopulation 总体总体已制造或将要制造对象的全体集合,用所关注的特性描述我们究竟能否知道真正的整体参数?lSample 样本样本 统计研究中实际测量的目标组 样本通常是整体的子集=整体标准差S=样本标准差Population整体sample样本1/17/2022描述计量型数据集描述计量型数据集“报告上司:河水深度1.6M, 士兵平均高度1.7M, 过河没有问题”,但是.至于我们不能只看

7、平均值, 还需要利用其他统计量来分析1/17/2022描述计量型数据集描述计量型数据集一组计量型数据能显示以下3个特性:Central Tendency (Mean, Median, Mode)中央趋势 (均值, 中值, 众数)Variable (range, Standard Deviation, Variance )变异(全距, 标准差, 方差)Shape 形状1/17/2022参数和统计量符号参数和统计量符号Mean 均值Variance 方差Standard Deviation标准差Proportion 比例总体(参数)总体(参数)样本(统计量)样本(统计量) s s2 2s sp p

8、1/17/2022位置测量位置测量( Central Tendency )中心趋势中心趋势Mean 均值均值Median 中值中值Mode 众数众数Quartiles 四分值四分值1/17/2022样本均值样本均值若样本(样本量为n)的观测值为x1,x2,xn,则样本均值为: 类似地,一个有着大量但限个(N个)观测值的总体,其总体均值 为:Mean 均值均值xNxNii1nxnxxxxniin121.1/17/2022Mean 均值均值练习三练习三10个连接线的拉拔强度为 :260 230 240 236 248248 252 278 265 262249拉拔强度的均值是多少?25010个观测

9、值的均值为:10262.2402302601nxxnii1/17/2022Mean 均值均值练习四练习四199X年一个行动中,战机进行了3000次战斗,总共用时6900小时。那末每次战斗平均用时多少?每次战斗平均用时为:hoursNxNii3 . 2300069001注意所使用的符号1/17/2022 均值的特性均值的特性l 均值的计算使用了每个观测值;每个观测值对均值都有影响。l 所有观测值对均值的偏差的总和为零。l 均值对极端的观测值很敏感,极端值会导致均值向他偏移。X x x x x x x6 3 5 1 2 7 4624x1/17/2022Median 中值中值 将一组观测值按大小顺序

10、排列,位于中心的数将一组观测值按大小顺序排列,位于中心的数值即为中值值即为中值l 若观测值的个数为偶数,则中值为中间2个数值的平均l 若观测值的个数为奇数,则位于中心的数值即中值1/17/2022Median 中值中值样本中值样本中值 l 假如x (1),x (2) ,x (n) )是按大小排序的样本值,则样本中值为: l 中值的优点是不受极端大或极端小的观测值的影响。2)12/()2/()2/1(nnnxxxMe为奇数n odd isn if为偶数neven isn if1/17/2022Median 中值中值练习五练习五(a)假设一个样本观测值为 :(b) 3 1 2 4 7 8 6l 样

11、本均值和样本中值是多少?l 这2个值是测量数据中心趋势的合理指标吗? 1/17/2022Median 中值中值(b) 假如最后一个数值改变为 : 3 1 2 4 7 8 2680l 则样本平均值和样本中值是多少?l 据此你有何结论? 1/17/2022Median 中值中值Median vs Mean 中值与均值中值与均值l 因为中值不象均值对极端值敏感,因此,当有极端大或极端小值时,中值比均值更能代表数据的位置l 典型的例子是一个城市居民的收入中位值1/17/2022中值有时会有欺骗性中值有时会有欺骗性50%-50% Rule ? 一半一半准则?一半一半准则?l 以下一组数据的中值是多少?

12、2,2,2,2,2,2,90l 可以用一半一半准则吗?1/17/2022Mode 众数众数l 众数是样本中出现次数最多的观测值。l 众数可以是唯一的,也可以有不止一个,有时并不存在众数。1/17/2022Mode 众数众数练习六练习六如果样本观测值为:(a) 6 9 13 5 8 13 4 6 13 1 10 13(b) 6 9 13 5 8 13 4 6 13 1 10 6 2 5 6 13(c) 4 3 7 2 6 8 1(d)众数是什么?(e) 具有一个众数,两个众数或多于两个众数分布的数据分布叫什么?(单峰分布)1/17/2022Mode 众数众数为何使用众数为何使用众数?l 当观测值

13、为分类式(如名义数据, 序列数据)时.众数是描述数据位置的最好的指标.l典型的例子是,一个公司内员工收入的众数众数的重要信息众数的重要信息l当众数不止1个时,从中抽取样本的总体通常是多个总体 的混合1/17/2022均值、中值、众数的比较均值、中值、众数的比较x2 1xMOMe21MeMOx正态分布偏上分布偏下分布xMOMexMOMexMOMe1/17/2022Quartiles 四分值四分值l 将一组按大小顺序排列的数据平均分为四部分,分界点即四分值. 第一四分值(低四分值),约25%的观测值小于它.第二四分值,约50%的观测值小于它, 即中值.第三四分值(高分值),约75%的观测值小于它.

14、1/17/2022Quartiles 四分值四分值练习七练习七 以下为20个电灯泡失效期间的观测值, 已按递增顺序排列.210 216 252 300 366 454 624 720 816 924 12161296 1392 1488 1542 2480 2856 3192 3528 3710请确定三个四分值.计算方法:先确定位置再计算四分值Q1的位置:(n+1)/4Q2的位置:2(n+1)/4=(n+1)/2Q3的位置:3(n+1)/41/17/2022Quartiles 四分值四分值答案答案 Q1的位置:(n+1)/4=(20+1)/4=21/4=5.25Q2的位置:2(n+1)/4=2

15、(20+1)/4=2*21/4=10.5Q3的位置:3(n+1)/4=3(20+1)/4=3*21/4=15.75则:Q1=366+(454-366)*0.25=388Q2=924+(1216-924)*0.5=1070Q3=1542=(2480-1542)*0.75=2245.51/17/2022Quartiles 四分值四分值1/17/2022散布的测量散布的测量(变异变异)lRange 极差极差lVariance 方差方差lStandard Deviation 标准差标准差lInter-Quartile Range 四分植极差四分植极差 1/17/2022Range 极差极差l样本极差为

16、样本中最大和最小观测值之间的差别,即:l极差是测量数据散布或变异的最简单的方法l但它忽略了最大和最小值之间的所有信息r =xmax - xmin1/17/2022Range 极差极差l试考虑以下的2个样本: 10 20 50 60 70 90 and 10, 40, 40, 40, 90l具有相同的极差(r= 80)l但是,第二个样本的变异只是2个极端数值的变异,而在第1个样本,中间的数值也有相当大的变异. l当样本量较小(n10)时,极差丢失信息的问题不是很严重1/17/2022方差与标准差方差与标准差l若若x1, x2, ,xn 是一个具有N个观测值的样本,则样本方差为:l样本标准差是样本

17、方差的算术平方根,即:1)(122nxxsnii1)(12nxxisni1/17/2022方差计算方差计算练习八:计算下列观测值的方差和标准差.30 50 70 90 110 130 1)(122nxxsnii1/17/2022方差计算方差计算1)(122nxxsniii xi xi-x (xi-x)2 1 30 -50 25002 50 -30 9003 70 -10 1004 90 10 1005 110 30 9006 130 50 2500480ix0)(xxi70002)(xxi806480 x400, 1) 16(000, 72s1/17/2022方差与标准差方差与标准差l再考虑以

18、下2个样本. Sample A : 10 20 50 60 70 90 Sample B : 10 40 40 40 40 90 Sample A Sample BRange 极差 80 80Variance 方差 ? ?Standard Deviation 标准差 ? ? 1/17/2022方差与标准差方差与标准差l类似于样本方差S2,用总体的所数据计算出总体变异总体方差(2)l总体的标准差()是总体方差的算术平方根l 对于包含N个数值的有限总体,其方差为: 2=NxNii12)(1/17/2022方差特性方差特性l 方差计算使用了所有观测值,每个观测值对方差都有影响l 方差对极端值很敏感,

19、因平方的缘故,极端大的观测值会严重的放大方差。1/17/2022四分值极差四分值极差l 四分值极差是测量散布的另一指标:IQR=Q3-Q1l 四分值极差不如极差对极端值敏感l 当分布显著不对称时,用它衡量散布会更好l 样本(10,20,50,60,90)和(10,40,40,40,90)的四分值极差分别是40和0.1/17/2022The Normal Distribution 正态分布正态分布l正态分布是一种具有特定的、非常有用的特性的数据分布 l这些特性对我们理解所研究之过程的特性十分有用l大部分自然现象和人造过程是正态分布或可有正态分布描述1/17/2022The Normal Dist

20、ribution 正态分布正态分布特性 1 :只需知道下述两项参数就可完整描述正态分布均值标准差分布 1分布 2分布 3此三项正态分布有何区别?此三项正态分布有何区别?1/17/2022正态曲线和概率正态曲线和概率特性 2 :曲线下面的面积可用来估算某一特定事件发生 的累积概率得到在两个值之间的某个价值的累积概率99.73%95%68%离均值的标准差数目离均值的标准差数目样本值的概率40%-30%-20%-10%-0%-1/17/2022标准差的经验规则标准差的经验规则l 当一组数据不是最理想正态分布时,前述累积概率规则仍可 应用l比较理论(理想)正态分布和经验(现实)分布Number of

21、Standard Deviations 标准差数目Theoretical Normal 理论正态Empirical Normal经验正态+/- 168%60-75%+/- 295%90-98%+/- 399.7%99-100%1/17/2022正态分布特点正态分布特点-3-2-112368%95%99.73%Standard Deviation标准差Average标准差1/17/2022长期和短期能力(Z-偏差)ZLT=ZST-1.5 Sigma水平 短期DPMO 长期DPMO 1158655.3691462.5 2 22750.1308537.5 3 1350.0 66807.2 4 31.

22、7 6209.7 5 0.3 232.7 6 0.0018 3.41/17/2022正态分布正态分布鉴于许多过程输出都是呈正态分布,所以可以用正态曲线的特点预测过程对象总体.即使非正态数据也能 转化为正态数据, 所以 正态曲线的特点仍然可 以用来做预测 1/17/2022正态曲线下的区域正态曲线下的区域分析过程能力时,我们运用正态曲线下的区域预测超过规格界限的产品所占的比例.5%5%规格上限USL规格下限LSL1/17/2022标准正态分布标准正态分布标准正态分布,也叫Z分布,有下列参数:Z代表距离均值的标准差的数量=0 =1yz -4 -3 -2 -1 1 2 3 4 1/17/2022Z

23、Z 代表代表从从均均值值到能在到能在达达到到( (容容纳纳) )多少多少个标个标准差准差 -4 -3 -2 -1 1 2 3 4 3S的Z数值是多少1/17/2022将实际单将实际单位位转转化化为为Z Z单单位位文员职位安排时间u= 20.0days= 5 days5 10 15 20.0 25 30 35 -3 -2 -1 1 2 3 Days zScale 有多少是需要10至30天?1/17/2022确定确定对应对应Z Z数值数值l有多少是需要24天以上?Days Z Scale 5 10 15 20.0 25 30 35 -3 -2 -1 1 2 3 ?80. 050 . 450 .200 .24yz241/17/2022Days Z Scale 使用使用Z Z 图图表表80. 050 . 450 .200 .24yz5 10 15 20.0 25 30 35 -3 -2 -1 1 2 3 21%12.0u = 20.0days= 5 daysZ=0.80P=0.2119From z Table1/17/2022使用使用Z Z 图图表表5 10 15 20.0 25 30 35 -3 -2 -1 1 2 3 ?28.0Days Z Scale u = 20.0days= 5 daysu利用先前的例子,决定需要28天以上的比例是多少? yzP=0.05481/17/2022

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁