《统计学的基本概念.pptx》由会员分享,可在线阅读,更多相关《统计学的基本概念.pptx(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 1本资料来源本资料来源6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 2(6 6导论)导论)(GB103)(GB103)6 6管理模式管理模式统计学基本概念统计学基本概念6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 3主主 要要 内内 容容1.1.波动波动(偏差偏差)。2.2.连续变量和逻辑变量。连续变量和逻辑变量。3.3.均值均值,中位数中位数,众数众数,极差极差,方差方差,标
2、准偏差。标准偏差。4.正态曲线。正态曲线。5.5.带正值的标准化数据。带正值的标准化数据。6.6.中心极限定律。中心极限定律。7.7.过程能力一用过程能力一用Z Z值作为恒量尺度。值作为恒量尺度。6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 4波动的型式与原因波动的型式与原因 任任何何过过程程都都包包含含随随机机波波动动(由由于于一一般般或或普普遍遍原原因因造造成的成的)和和非随机波动非随机波动(由于特殊原因造成的由于特殊原因造成的)。时时 间间不合格产品率不合格产品率特殊波动特殊波动历史水平历史水平(0)最佳水平最佳水平(1)在在 0
3、(3 0)范围内的范围内的随机波动随机波动在在 1(3 1)范围内的范围内的随机波动随机波动6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 5普遍原因普遍原因:过程波动随时间推移是稳定的过程波动随时间推移是稳定的,可预测的可预测的处于控制状态处于控制状态原因原因:固有的或是自然的固有的或是自然的 例如例如例如例如:垂直向上空(先把硬币夹垂直垂直向上空(先把硬币夹垂直垂直向上空(先把硬币夹垂直垂直向上空(先把硬币夹垂直)抛掷一枚硬币,抛掷一枚硬币,抛掷一枚硬币,抛掷一枚硬币,统计硬币落地后每一面向上的次数。当抛掷次数很多时,统计硬币落地后每
4、一面向上的次数。当抛掷次数很多时,统计硬币落地后每一面向上的次数。当抛掷次数很多时,统计硬币落地后每一面向上的次数。当抛掷次数很多时,每面向上的次数大约各占一半,只有微小差异。每面向上的次数大约各占一半,只有微小差异。每面向上的次数大约各占一半,只有微小差异。每面向上的次数大约各占一半,只有微小差异。普遍原因:普遍原因:差异的原因:有风,每次抛掷动作有微小差异,地面不平整,等等。波动的型式与原因波动的型式与原因 6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 6特殊原因特殊原因:过程波动无法预测过程波动无法预测(按小时按小时,按天或按周按
5、天或按周)处于失控状态处于失控状态原因原因:机器调整不当机器调整不当,原材料不合格原材料不合格,操作者本身操作者本身目标目标:检测和消除特殊原因检测和消除特殊原因特殊原因:特殊原因:例如例如例如例如:同样是抛硬币,抛同样是抛硬币,抛同样是抛硬币,抛同样是抛硬币,抛1000100010001000次,次,次,次,ABABABAB两面两面两面两面 各自向上的次数却相差各自向上的次数却相差各自向上的次数却相差各自向上的次数却相差400400400400多次。多次。多次。多次。原因:操作者每次抛掷时,总时将硬币平放,且总是将正面朝上,然后抛出。波动的型式与原因波动的型式与原因 6 6 6 6管理模式统
6、计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 7数据的两种类型数据的两种类型连续连续(可可变变)数据:数据:使用一种度量单位,比如英寸或小时。使用一种度量单位,比如英寸或小时。连续连续(可可变变)数据的例子:电压、电流、数据的例子:电压、电流、功率、时间、距离、重量、速度。功率、时间、距离、重量、速度。离散离散(逻辑逻辑)数据:数据:是类别信息,比如是类别信息,比如“合格合格”或或“不合格不合格”。6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 8统计领域用下列方法处理波动统计领域用下列方法处理波动(偏差
7、偏差):描述型统计用图表或总结性的数字描述型统计用图表或总结性的数字 (均值,方差,均值,方差,标准偏差标准偏差)来描述一系列数据。来描述一系列数据。统统 计计 推推 断当结果差异可能因为随机偏差或不能归断当结果差异可能因为随机偏差或不能归 属为随机偏差时所作的决定属为随机偏差时所作的决定(假设检验假设检验)。试试 验验 设设 计计收集并分析数据估计过程改变效果。收集并分析数据估计过程改变效果。数理统计的作用数理统计的作用6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 9总体和样本总体和样本总体总体(母体母体):它是提供数据的原始集团,是
8、所要研究分析它是提供数据的原始集团,是所要研究分析的对象的全部。总体可以是一批产品(由于一批的对象的全部。总体可以是一批产品(由于一批产品的数量是有限的,故称为有限总体产品的数量是有限的,故称为有限总体),也可以,也可以是一道工序所生产的所有产品(由于其源源不断是一道工序所生产的所有产品(由于其源源不断的运行,甚至也包含今后的产品,故称为无限总的运行,甚至也包含今后的产品,故称为无限总体体)样本样本(子样,抽样,试样子样,抽样,试样):从总体中抽出一部分个体,总体中的这一部从总体中抽出一部分个体,总体中的这一部分个体称之为样本。它是直接被检测并提供数据分个体称之为样本。它是直接被检测并提供数据
9、的诸个体。的诸个体。6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 10连续数据的测量连续数据的测量如何描述数据的统计特性:如何描述数据的统计特性:measures of location(central tendency居中程度居中程度)measures of dispersion(variation离散程度离散程度)6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 11描述数据的居中程度描述数据的居中程度Mean均值均值Median中位数中位数Mode众数众数Quartiles四分
10、位数四分位数6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 12 输出值输出值 聚集在某个中心值附近聚集在某个中心值附近居中居中趋势趋势平均值,中位数,众数,平均值,中位数,众数,四分位数四分位数是所有居中趋势的测量是所有居中趋势的测量6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 13均均 值值(中心值中心值)均值均值 总体或样本的平均值。总体或样本的平均值。总体的中心值用总体的中心值用 表示。表示。样本的中心值用样本的中心值用x 表示。表示。样本均值的计算公式如下:样本均值的计算
11、公式如下:The mean is the most common measure of location or center of the data.6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 14中中 位位 数数 中位数中位数 反应样本数据中间反应样本数据中间50%的数值,一系列数据的数值,一系列数据 由低到高排列后所得到的中间数。由低到高排列后所得到的中间数。偶数偶数奇数奇数6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 15 众数众数众数众数-在一个数据集中最频繁出现的值。
12、在一个数据集中最频繁出现的值。在一个数据集中最频繁出现的值。在一个数据集中最频繁出现的值。众众 数数The mode is the observation that occurs most frequently in the sample.The mode may be unique,or there may be more than 1 mode.Sometimes,the mode may not exist.6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 16Range极差Variance方差Standard Deviation标准
13、偏差Inter Quartile Range内四分位极差描述数据的离散程度描述数据的离散程度6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 17离散程度的测量离散程度的测量用来判定一个数据用来判定一个数据 集合离散程度或宽度的恒量尺度集合离散程度或宽度的恒量尺度极极 差差-在一个样本中最大值与最小值的差值。在一个样本中最大值与最小值的差值。极差极差=最大值最大值-最小值最小值 即:即:R=x(max)x(min)方方 差差 与中心值间距的平方和的平均值。与中心值间距的平方和的平均值。总体的方差用总体的方差用 表示表示 样本的方差用样本的方
14、差用 s s2 2 表示表示标准偏差标准偏差 是方差的平方根是方差的平方根。总体标准偏差由总体标准偏差由 表示表示 样本标准偏差由样本标准偏差由 s s 表示表示6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 18Units of Measure直方图块的中点中心光滑连接形成曲线大多数(但不是所有)数大多数(但不是所有)数据是正态分布或钟形曲线据是正态分布或钟形曲线正正 态态 分分 布布6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 19 在许多实际问题中在许多实际问题中,我们遇到的
15、随机变量都受到为数众我们遇到的随机变量都受到为数众多的相互独立的随机因素的影响多的相互独立的随机因素的影响,而每一个别因素的影响都而每一个别因素的影响都是微小的是微小的,且这些影响是可以叠加的且这些影响是可以叠加的.例如例如,电灯在指定条件下的耐用时间受到原料电灯在指定条件下的耐用时间受到原料,工艺工艺,保保管等条件的影响管等条件的影响,而且每一种因素在正常情形下都是均匀地微而且每一种因素在正常情形下都是均匀地微小且可以叠加的小且可以叠加的.具有上述特点的随机变量一般都可以认为具有上述特点的随机变量一般都可以认为是具有正态分布的随机变量是具有正态分布的随机变量.在现实生产生活中在现实生产生活中
16、,我们所遇到实际问题大多数都属于我们所遇到实际问题大多数都属于具有正态分布的随机变量具有正态分布的随机变量,因此在此我们重点讨论研究此类因此在此我们重点讨论研究此类分布分布.正正 态态 分分 布布 简简 介介6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 20正态分布的特点:正态分布的特点:1.1.形态如钟;形态如钟;2.2.左右对称;左右对称;3.3.于平均值处分布的频数最多。此外,越远离平均值,分布的频于平均值处分布的频数最多。此外,越远离平均值,分布的频 数也越少。数也越少。正态分布的要素:正态分布的要素:1.1.平平 均均 值:决
17、定正态分布曲线的中心位置;值:决定正态分布曲线的中心位置;2.2.标准偏差:决定正态分布曲线的标准偏差:决定正态分布曲线的“宽窄宽窄”.”.为何要研究正态分布为何要研究正态分布?1.1.它是自然界的一种最基本的最普遍的法则,反应了事物内在的变化规律;它是自然界的一种最基本的最普遍的法则,反应了事物内在的变化规律;2.2.它使我们得以将许多复杂的事物简化处理;它使我们得以将许多复杂的事物简化处理;3.3.它使我们得以通过少量抽样来把握全体,从而节省大量人力,物力,财它使我们得以通过少量抽样来把握全体,从而节省大量人力,物力,财 力和时间。力和时间。正正 态态 分分 布布 简简 介介6 6 6 6
18、管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 21正态检验为什么有用?正态检验为什么有用?许多统计检验(均值和方差的检验)都假定数据是正许多统计检验(均值和方差的检验)都假定数据是正态分布的,正态检验用来判定该假定是否有效。态分布的,正态检验用来判定该假定是否有效。何时用正态检验?何时用正态检验?当你分析数据并要计算基本统计值如当你分析数据并要计算基本统计值如Z Z值或假定正态性值或假定正态性的统计检验如的统计检验如T-T-检验或方差分析检验或方差分析(ANOVA)ANOVA)时。时。分布的正态性检验分布的正态性检验6 6 6 6管理模式统计学基本概
19、念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 22如何做正态性检验?如何做正态性检验?采用采用Minitab公司的专业统计软件公司的专业统计软件MINITAB:6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 23如何做正态性检验?如何做正态性检验?方法方法方法方法1 1:从从Minitab的菜单选项里的菜单选项里,选择选择:Stat Basic Statistics Normality Test打开数据文件打开数据文件:DOT-BOX-HISTOGRAM.MTV6 6 6 6管理模式统计学基本概念管理模式统计学基本
20、概念管理模式统计学基本概念管理模式统计学基本概念 24如何做正态性检验?如何做正态性检验?从从Minitab的菜单选项里的菜单选项里,选择选择 Stat Basic Statistics Normality Test.我们可以看到下图的对话框。我们可以看到下图的对话框。6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 25变量:选择一列数据用于变量:选择一列数据用于X X轴。轴。正态检验正态检验:有有3 3种类型,通常用种类型,通常用Anderson-Darling test.标题标题:用你自拟的题目取代默认的。用你自拟的题目取代默认的。单
21、击单击 OK.OK.图形输出如下图图形输出如下图。正态概率图正态概率图:如何做正态性检验?如何做正态性检验?6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 26如何做正态性检验?如何做正态性检验?方法方法方法方法2 2:从从Minitab的菜单选项里的菜单选项里,选择选择:Stat Basic Statistics Display Descriptive Statistics 打开数据文件打开数据文件:DOT-BOX-HISTOGRAM.MTV6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基
22、本概念 27如何做正态性检验?如何做正态性检验?从从Minitab的菜单选项里的菜单选项里,选择选择:Stat Basic Statistics Display Descriptive Statistics我们可以看到下图的对话框。我们可以看到下图的对话框。6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 28如何做正态性检验?如何做正态性检验?结果显示结果显示结果显示结果显示:P-ValueP-Value大大 于于 0.05,0.05,判判定定数数据据的的分分布布为为正态分布。正态分布。(冒险概率冒险概率=0.05)=0.05)6 6 6
23、 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 29如何做正态性检验?如何做正态性检验?显示在图上的总结包括添加了分布曲线的直方图和显示在图上的总结包括添加了分布曲线的直方图和Anderson Darling正态检正态检验的验的P值值(显示在右上角)(显示在右上角)。正态检验的通常规则当正态检验的通常规则当P值小于或等于值小于或等于0.05则认为样本数据的分布不同于标则认为样本数据的分布不同于标准的正态分布。相反,当准的正态分布。相反,当P值值 大于大于0.05,则认为样本数据的分布与正态没有显著,则认为样本数据的分布与正态没有显著差异。差异。进一
24、步解释:正态性检验属于根据样本来检验关于进一步解释:正态性检验属于根据样本来检验关于总体分布总体分布的检验方法,属的检验方法,属于数学中的非参数检验方法。对于正态检验,于数学中的非参数检验方法。对于正态检验,原原 假假 设设 为:为:H0:总体的分布与总体的分布与正态分布无显著差异;正态分布无显著差异;对立假设为:对立假设为:H1:总体的分布与总体的分布与正态分布有显著差异。正态分布有显著差异。其中其中P值代表值代表判断总体数据分布和正态分布没有显著差异的可能性判断总体数据分布和正态分布没有显著差异的可能性。上图表。上图表现了数据分布的直方图及分布曲线,从图中我们可以看出此图不是正态分布。现了
25、数据分布的直方图及分布曲线,从图中我们可以看出此图不是正态分布。结果说明:结果说明:结果说明:结果说明:6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 30Visual interpretation the data set.Common graphical tools to illustrate a data set:Dot Plot 散点图散点图Box Plot 盒子图盒子图Histogram 直方图直方图图形工具描述图形工具描述6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 3
26、1散点图散点图(Dot Plot)The dot plot is useful for displaying a small body of data.散点图更易分析样本容量较少的参数特性。散点图更易分析样本容量较少的参数特性。The location or central tendency in the data set and its spread or dispersion are easily identified.散点图散点图对单个样本数据的对单个样本数据的居中程度和离散程度居中程度和离散程度都很容易都很容易看出来。看出来。It can also be used in compari
27、ng two or more data sets.散点图还可用于定性地比较两组样本或多组样本的数据散点图还可用于定性地比较两组样本或多组样本的数据之间有无显著差异。之间有无显著差异。6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 32案例:某器件案例:某器件AM5003特性参数电流增量特性参数电流增量(mA):批次批次A:4.5,7.3,4.8,6.2,8.7,5.1,3.5,5.4,4.6,3.8批次批次B:4.5,7.3,4.8,6.2,8.7,5.1,11,13,9.7,10.5Minitab:Graph Dotplot 散点图散点
28、图(Dot Plot)打开数据文件打开数据文件:DOT-BOX-HISTOGRAM.MTV6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 33结论:结论:结论:结论:散点图散点图散点图散点图 结果显示:批次结果显示:批次结果显示:批次结果显示:批次A A的电流增量比较集中,均值小,因此批次的电流增量比较集中,均值小,因此批次的电流增量比较集中,均值小,因此批次的电流增量比较集中,均值小,因此批次A A的的的的 质量比较稳定;而批次质量比较稳定;而批次质量比较稳定;而批次质量比较稳定;而批次B B的电流增量比较分散,均值较大,性能较差。的电
29、流增量比较分散,均值较大,性能较差。的电流增量比较分散,均值较大,性能较差。的电流增量比较分散,均值较大,性能较差。图形结果显示:图形结果显示:散点图散点图(Dot Plot)批次批次批次批次A A批次批次批次批次B B6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 34盒子图盒子图(Box Plot)Not to be used when sample size is less than 10 units.Not to be used when sample size is less than 10 units.注意:当样本容量小于注意
30、:当样本容量小于注意:当样本容量小于注意:当样本容量小于 10 10 时请勿采用!时请勿采用!时请勿采用!时请勿采用!盒子图盒子图是比较样本数据间的分布差异是比较样本数据间的分布差异,中心位置和中心位置和分散大小。分散大小。和散点图相近,都是用来和散点图相近,都是用来分析样本数据的分析样本数据的居中程度居中程度和离散程度,和离散程度,但比散点图更直观,更有效。但比散点图更直观,更有效。6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 35*异常点异常点 75%数数(3/4分位分位)Q3Q1MaxMinimum,Q1-1.5 IQRQ3+Mi
31、nMaximum,Q3+1.5 IQR 25%的数的数(1/4分位分位)Q1中位数中位数(1/2分位分位)Q2注:注:盒子的高度盒子的高度内四分位极差内四分位极差(IQR)Inter Quartile Range Q3-Q1 盒子图盒子图(Box Plot)数据的中心数据的中心50%50%(盒子的高度盒子的高度)6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 36Minitab:Graph Boxplot:盒子图盒子图(Box Plot)打开数据文件打开数据文件:DOT-BOX-HISTOGRAM.MTV单个样本数据分析:单个样本数据分析
32、:6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 37图形结果显示图形结果显示单个样本数单个样本数据分析:据分析:盒子图盒子图(Box Plot)6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 38盒子图盒子图(Box Plot)打开数据文件打开数据文件:DOT-BOX-HISTOGRAM.MTV多个样本数据比较分析多个样本数据比较分析:6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 39盒子图盒子图(Box Plot)图形结果
33、显示图形结果显示多个样本数据比较分析多个样本数据比较分析:6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 40直方图直方图(Histogram)The histogram,a graphical presentation of the frequency distribution,provides a visual impression of the shape ofthe distribution of measurements.直方图表征数据的概率分布,主要应用在了解数据分布的形状直方图表征数据的概率分布,主要应用在了解数据分布的形状
34、 及形态。便于掌握数据的居中趋势,数据的分布等。及形态。便于掌握数据的居中趋势,数据的分布等。X-axis:measurement scale 测量数据的区间划分,测量数据的区间划分,随着区间的调随着区间的调 整整,数据的形状分布略有不同。数据的形状分布略有不同。Y-axis:frequency(or relative frequency)scale 事件发生的频数。事件发生的频数。Not to be used when sample size is less than 50 units.Not to be used when sample size is less than 50 units
35、.注意:当样本容量小于注意:当样本容量小于注意:当样本容量小于注意:当样本容量小于 50 50 时谨慎使用直方图!时谨慎使用直方图!时谨慎使用直方图!时谨慎使用直方图!6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 41Minitab:Graph Histogram直方图直方图(Histogram)打开数据文件打开数据文件:DOT-BOX-HISTOGRAM.MTV6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 42图形结果显示:图形结果显示:直方图直方图(Histogram)6 6
36、 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 43中心极限定律中心极限定律概率论基本概念:概率论基本概念:概率论基本概念:概率论基本概念:1.1.随机变量根据试验结果对随机变量根据试验结果对随机试验随机试验取什么值的变量。取什么值的变量。2.随机事件的频率随机事件的频率 设随机事件设随机事件A在在n次试验中出现了次试验中出现了r次,次,则称比值则称比值r/n为这为这n次试验中事件次试验中事件A出现的频率,记作出现的频率,记作W(A)即:即:W(A)=r/n 3.概率的统计定义随着试验次数概率的统计定义随着试验次数n的增大,事件出现的频的增大,
37、事件出现的频率率r/n在区间在区间0,1上的某个数字上的某个数字p附近摆动,那么定义事件的附近摆动,那么定义事件的概率为:概率为:P(A)=p 根据根据贝努里大数定理贝努里大数定理,在实际应用中,当试验次数很大时,便可以用事,在实际应用中,当试验次数很大时,便可以用事件出现的频率来代替事件发生的概率。件出现的频率来代替事件发生的概率。6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 44中心极限定律中心极限定律在实际问题中,有许多随机变量,它们是由大量的相互独立的随机因素在实际问题中,有许多随机变量,它们是由大量的相互独立的随机因素的综合影
38、响所形成的,即可以表示成独立随机变量之和,的综合影响所形成的,即可以表示成独立随机变量之和,这种随机变量这种随机变量往往近似地服从正态分布往往近似地服从正态分布,这就是中心极限定律地客观背景。,这就是中心极限定律地客观背景。1.独立同分布地中心极限定理独立同分布地中心极限定理指出指出:设独立随机变量序列设独立随机变量序列X1,X2,Xn,服从同一分布服从同一分布,并具有有限的数学期望和方差,则只要,并具有有限的数学期望和方差,则只要n充分充分大,大,不管不管Xi 服从什么分布服从什么分布,近似地服从正态分布近似地服从正态分布2.德莫佛拉普拉斯定理德莫佛拉普拉斯定理指出:当指出:当n很大时,在很
39、大时,在n次独立重复试验中事次独立重复试验中事件件A发生地次数近似服从正态分布。从而服从二项分布的随机变量近发生地次数近似服从正态分布。从而服从二项分布的随机变量近似服从正态分布似服从正态分布N(np,np(1-p)。(在次品率为(在次品率为 p p 的一大批产品中任取的一大批产品中任取 n n 件产品,那么取得次品的件数件产品,那么取得次品的件数 服服 从二项分布从二项分布)。6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 45例例1 1“总销售量总销售量”是许多许多经销商销售的总和,一个销售是许多许多经销商销售的总和,一个销售商可能不
40、是正态分布,但总的销售量大致是正态分布的。商可能不是正态分布,但总的销售量大致是正态分布的。例例2许多产品的堆积高度大致是正态分布,即使单一产品高许多产品的堆积高度大致是正态分布,即使单一产品高度不是正态分布。度不是正态分布。注意:不是所有数据服从正态分布,注意:不是所有数据服从正态分布,注意:不是所有数据服从正态分布,注意:不是所有数据服从正态分布,如何检验正态性,及数据如何检验正态性,及数据如何检验正态性,及数据如何检验正态性,及数据 非正态时如何办?非正态时如何办?非正态时如何办?非正态时如何办?中心极限定律中心极限定律中心极限定律指出,对于大数值中心极限定律指出,对于大数值 n 即使单
41、个的数据分布即使单个的数据分布可能是非正态的,其样本平均值可以估计是正态的。可能是非正态的,其样本平均值可以估计是正态的。6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 46 个体分布个体分布平均值平均值:每一个每一个平均值来平均值来源于源于n个个测量值。测量值。X总平均值总平均值)X在每个子群中有在每个子群中有n n个抽样数个抽样数中心极限定律中心极限定律6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 47参参 数数 估估 计:计:1.1.点点 估估 计计对参数作定值估计,如用样本
42、均值和样本方差作为对参数作定值估计,如用样本均值和样本方差作为总体的均值和方差的估计值。总体的均值和方差的估计值。2.2.区间估计区间估计点估计只是一种近似值点估计只是一种近似值,既没有反应这种近似值的既没有反应这种近似值的精确度精确度,又不知道它的误差范围。此时就引入了置信区间这个概念,又不知道它的误差范围。此时就引入了置信区间这个概念,它不仅能够反应点估计的误差范围它不仅能够反应点估计的误差范围,还能反应估计值落在该区间的还能反应估计值落在该区间的概率即置信度概率即置信度。统统 计计 术术 语语6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基
43、本概念 48置置 信信 度度置信度是指置信度是指总体总体的均值与标准偏差有多大可能性落在以的均值与标准偏差有多大可能性落在以样本样本为基础计算为基础计算出的置信区间中出的置信区间中!工业行业一般采用工业行业一般采用 95%95%的置信度的置信度,它意味着它意味着:总体总体的均值与标准偏差落在置信区间中的概率是的均值与标准偏差落在置信区间中的概率是95%!95%!总体总体的均值与标准偏差落在置信区间之外的概率的均值与标准偏差落在置信区间之外的概率(风险风险)是是5%!5%!如果需要更高的置信度如果需要更高的置信度(99%(99%置信度置信度)置信区间会怎样置信区间会怎样?“我现在有我现在有95%
44、的信心投中所有的的信心投中所有的球。如果加宽球门,信心将更大球。如果加宽球门,信心将更大!”6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 49注意:真实的总体均值和标准偏差或者不合格品注意:真实的总体均值和标准偏差或者不合格品注意:真实的总体均值和标准偏差或者不合格品注意:真实的总体均值和标准偏差或者不合格品率是确定的率是确定的率是确定的率是确定的,只不过它们的数值是未知的。只不过它们的数值是未知的。只不过它们的数值是未知的。只不过它们的数值是未知的。u逻辑变量逻辑变量:u确定置信度确定置信度(95%(95%)。u用样本的不合格品率和样
45、本尺寸计算置信限以确定置信区间。用样本的不合格品率和样本尺寸计算置信限以确定置信区间。u连续变量连续变量:u确定置信度确定置信度(95%(95%)。u用样本的平均值,标准偏差和样本尺寸计算置信限以确定置信用样本的平均值,标准偏差和样本尺寸计算置信限以确定置信区间。区间。u可用可用Minitab Minitab 或手工方法计算置信限。或手工方法计算置信限。置信度置信度 VS 置信区间置信区间6 6 6 6管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念管理模式统计学基本概念 50置信区间太宽怎么办置信区间太宽怎么办?采用更大的样本采用更大的样本.允许的误差越小或置信区间越窄,允许的误差越小或置信区间越窄,需要的样本容量越大需要的样本容量越大!