《六西格玛分析阶段.pptx》由会员分享,可在线阅读,更多相关《六西格玛分析阶段.pptx(87页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、六西格玛普及培训六西格玛普及培训-分析分析第七步第七步确定关键因素确定关键因素目目 录录一、分析阶段目的一、分析阶段目的 二、图表分析二、图表分析三、多变量分析三、多变量分析第一部分第一部分 分析阶段目的分析阶段目的分析阶段要做什么分析阶段要做什么最佳化的过程最佳化的过程30- 504 - 83 - 6重要重要 X Xs s 选定选定5 - 8定义、测量定义、测量分析分析确认重要确认重要 X Xs s改进改进重要重要 X Xs s最佳化最佳化控制控制2 - 4重要重要 X Xs s 控制控制q分析阶段的目的:分析阶段的目的: 通过对数据的分析,确认通过对数据的分析,确认在测量阶段得出的对在测量
2、阶段得出的对Y Y有有影响的重要影响的重要XsXs 对对Y Y影响小的影响小的XsXs进行现进行现水准管理水准管理 把关键因素把关键因素(Xs)(Xs)压缩到压缩到4 48 8个左右之后个左右之后, , 在改进在改进阶段找出最适合的条件阶段找出最适合的条件分析阶段的步骤分析阶段的步骤v制定数据收集计划制定数据收集计划确定确定X X的量化指标,数据类型、以及数据收集目标的量化指标,数据类型、以及数据收集目标根据根据X X的特点确定采用的分析方法,可以每个因子单独验证的特点确定采用的分析方法,可以每个因子单独验证( (如比较分如比较分析析) ),也可以几个因子合在一起验证,也可以几个因子合在一起验
3、证( (如多变量分析、回归分析、如多变量分析、回归分析、DOE)DOE)制作数据收集表,包括制作数据收集表,包括X X及其响应及其响应(Y)(Y)的数据,确定收集的样本量的数据,确定收集的样本量如需要通过试验来收集,如通过人为改变如需要通过试验来收集,如通过人为改变X X的状态来观察的状态来观察Y Y的变化,还的变化,还需要做好试验计划需要做好试验计划v分析潜在关键因子对分析潜在关键因子对Y Y的影响的影响根据数据表收集数据根据数据表收集数据根据事先确定的分析方法来确认每个潜在的关键因子对根据事先确定的分析方法来确认每个潜在的关键因子对Y Y是否有显著是否有显著影响,或影响有多大影响,或影响有
4、多大v确定关键因子确定关键因子对对Y Y有显著影响的潜在因子确认为真正的关键因子,需要进行优化有显著影响的潜在因子确认为真正的关键因子,需要进行优化主要使用的工具主要使用的工具q图表分析图表分析 确认分布:直方图确认分布:直方图, , 点图,箱线图、散点图、矩阵图、边际图、点图,箱线图、散点图、矩阵图、边际图、柏拉图、时间序列图柏拉图、时间序列图.q多变量分析多变量分析q比较分析比较分析 均值检验:均值检验:1 1-sample t, 2-sample t, Paired t (-sample t, 2-sample t, Paired t (样本中同一样本中同一个体测量两次前后比较总体不独立
5、个体测量两次前后比较总体不独立), ANOVA), ANOVA(正态总体(正态总体=2=2) 方差检验:方差检验:Test for Equal variance-F testTest for Equal variance-F test(正态总体(正态总体2 2),),Bartletts Test(Bartletts Test(正态总体正态总体=2)=2),Levenes TestLevenes Test(非正态总(非正态总体)体) 比率检验:比率检验:1 1 Proportion, 2 Proportions, Chi-square testProportion, 2 Proportions,
6、 Chi-square test(总体(总体=2=2)q回归分析回归分析第二部分第二部分 图表分析图表分析 用图形对测量阶段找出的变量(KPIV)的“形态”进行描述,通过视觉来判断变量是否满足我们的期望,确定是否关键的KPIV好的图表才能说明问题好的图表才能说明问题引入图表引入图表分析分析的目的的目的图表分析可以把数据转化为我们需要的信息图表分析可以把数据转化为我们需要的信息 数据是信息的数据是信息的“原料原料” 加工处理的数据是提供可靠信息的源泉加工处理的数据是提供可靠信息的源泉 可靠的信息是我们作决策的基础可靠的信息是我们作决策的基础图表分析的作用图表分析的作用六西格玛管理强调以数据为基础
7、,六西格玛管理强调以数据为基础,以事实为依据!以事实为依据!图表分析的作用(续)图表分析的作用(续)q 掌握变量分布的形状掌握变量分布的形状, ,平均值的位置及方差平均值的位置及方差q 比较各变量分布的特性比较各变量分布的特性q 明确两个以上的变量之间的差异明确两个以上的变量之间的差异q 比较变量相对重要度比较变量相对重要度q 掌握变量数据随时间的变化掌握变量数据随时间的变化图表分析的步骤图表分析的步骤重点重点: :可靠数据的收集和正确的图表解释可靠数据的收集和正确的图表解释选定要分析的变量选定要分析的变量搜集及整理数据搜集及整理数据进行图表分析进行图表分析结果解释结果解释选择要分析的变量选择
8、要分析的变量 我们要分析的变量来自测量阶段的结果我们要分析的变量来自测量阶段的结果, ,在利用图表分析前我们首先要确定变量的类在利用图表分析前我们首先要确定变量的类型、分析的目的、选择什么方法等型、分析的目的、选择什么方法等搜集及整理数据搜集及整理数据在运用图表分析时,应该明确以下重要问题在运用图表分析时,应该明确以下重要问题: :由谁收集数据由谁收集数据谁运用这些数据谁运用这些数据收集数据的类型是什么收集数据的类型是什么数据怎样收集数据怎样收集收集的数据在过程的哪个环节收集的数据在过程的哪个环节 收集数据的频率收集数据的频率在数据收集前别忘了先做测量系统分析在数据收集前别忘了先做测量系统分析
9、图表分析的主要方法图表分析的主要方法连续型数据连续型数据分析什么问题分析什么问题分析方法分析方法数据类型数据类型 点点 图图 箱线图箱线图 柏拉图柏拉图 饼饼 图图连续型数据连续型数据 描述性统计描述性统计 点图、箱线图点图、箱线图 直方图直方图 确定单个变量(研究确定单个变量(研究对象)的分布对象)的分布比较在比较在2 2个、多个或者个、多个或者1 1个变量(研究对象)在个变量(研究对象)在多种状态下分布的差异多种状态下分布的差异连续型数据连续型数据 散点图散点图 边际图边际图 矩阵图矩阵图 时间序列图时间序列图确定确定2 2个或者多个因个或者多个因素之间的关系素之间的关系确定变量(研究对象
10、)确定变量(研究对象)的组成的组成离散型数据离散型数据图表菜单图表菜单Minitab 15 Minitab 15 提供分析数据的图表工具提供分析数据的图表工具! !在工作表中输入数据或把在工作表中输入数据或把EXCELEXCEL中的数据粘贴过来中的数据粘贴过来图表图表的选定及操作的选定及操作单个变量分布图单个变量分布图目的目的: :确定变量的基本信息确定变量的基本信息, ,包括分布的形状(是否正态分包括分布的形状(是否正态分布布? ?)、居中趋势(平均值和我们期望的有什么差距)、居中趋势(平均值和我们期望的有什么差距? ?)、)、离散情况(波动是否超出了我们的要求离散情况(波动是否超出了我们的
11、要求? ?)等)等我们想了解某些过程的基本信息我们想了解某些过程的基本信息 例如例如:1.:1.顾客投诉问题的处理时间顾客投诉问题的处理时间 2.2.加工尺寸加工尺寸 3.3.输出功率输出功率 与我们的要求与我们的要求( (期望期望) )有什么差异有什么差异? ? 通过分布分析可以解决以上问题通过分布分析可以解决以上问题确认基本统计量描述性统计确认基本统计量描述性统计描述性统计(描述性统计(Descriptive StatisticsDescriptive Statistics)可提供多种图表和数据可提供多种图表和数据的平均值及标准差,偏度,峰度,置信区间,正态分布等信息,的平均值及标准差,偏
12、度,峰度,置信区间,正态分布等信息,帮助我们确认基本统计量。帮助我们确认基本统计量。统计统计 基本统计量基本统计量 显示描述性统计显示描述性统计要养成首先做出基本统计量的习惯要养成首先做出基本统计量的习惯下面得到的数据,是某生产厂家统计的两个月材料采购计划下面得到的数据,是某生产厂家统计的两个月材料采购计划时间和实际交货时间的差值。时间和实际交货时间的差值。数据的收集来源:数据的收集来源: - - 该生产厂家该生产厂家2 2大类产品的物料;大类产品的物料; - - 记录两大类产品材料采购订单的执行情况记录两大类产品材料采购订单的执行情况(60(60个订单)。个订单)。用用MinitabMini
13、tab分析一下该生产厂家分析一下该生产厂家A A类产品材料采购订单的基类产品材料采购订单的基本统计值(本统计值(打开数据文件打开数据文件: : A A0101采购订单采购订单.MTW.MTW)举举 例例描述性统计描述性统计统计统计 基本统计量基本统计量 显示描述性统计显示描述性统计选择图形不仅可以查看基本统计量选择图形不仅可以查看基本统计量, ,还可以看出全体分布的柱状图还可以看出全体分布的柱状图输出结果分析输出结果分析: :)1/()( 122nXXSSnii标准差标准差(StDev(StDev):): 四分之一分位数四分之一分位数: : 把数据从小到大排列时把数据从小到大排列时, ,分位数
14、为分位数为25%25%; 四分之三分位数四分之三分位数: : 把数据从小到大排列时把数据从小到大排列时, , 分位数为分位数为75%75%; Trimmed Mean: Trimmed Mean: 把数据的上下分位各去掉把数据的上下分位各去掉5%5%后求平均。后求平均。标准误差标准误差 (SE Mean ):nSSxx描述性统计描述性统计描述性统计描述性统计: A: A类产品差值类产品差值 平均值平均值 下四分下四分 上四分上四分变量变量 N NN N* * 平均值平均值 标准误标准误 标准差标准差 最小值最小值 位数位数 中位数中位数 位数位数A A类产品差值类产品差值 30 0 1.40
15、1.84 10.06 -18.00 -6.00 4.00 6.0030 0 1.40 1.84 10.06 -18.00 -6.00 4.00 6.00变量变量 最大值最大值A A类产品差值类产品差值 30.0030.00输出图表分析输出图表分析: :描述性统计描述性统计3020100-10-20121086420A A类类产产品品差差值值频频率率均值1.4标准差10.06N30A A类类产产品品差差值值 直直方方图图(包包含含正正态态曲曲线线)统计统计 基本基本 图形化汇总图形化汇总图形结果汇总图形结果汇总点击输出图表分析输出图表分析: :图形结果汇总图形结果汇总3020100-10-20中
16、位数平均值6420-2第一四分位数-6.0000中位数4.0000第三四分位数6.0000最大值30.0000-2.35545.1554-1.31395.00008.009513.5199A 平方1.05P 值0.008平均值1.4000标准差10.0571方差101.1448偏度0.31992峰度1.52223N30最小值-18.0000Anderson-Darling 正态性检验95% 平均值置信区间95% 中位数置信区间95% 标准差置信区间9 95 5% % 置置 信信 区区 间间A A类类产产品品差差值值 摘摘要要点图点图Dot plotDot plot通过对通过对A01采购订单采购
17、订单例子的分析,做出例子的分析,做出A A类产品材料采购订单的分布图,利用类产品材料采购订单的分布图,利用Dot Dot PlotPlot对订单时间的变动进行分析对订单时间的变动进行分析q 对数据的平均、波动、倾向、分布都很容易看出来对数据的平均、波动、倾向、分布都很容易看出来q 利用变量功能的话,集团之间的变动也容易区分出来利用变量功能的话,集团之间的变动也容易区分出来图形图形 点图点图通过点图可以看出大部分订单的时间差值集中在通过点图可以看出大部分订单的时间差值集中在-6-68 8天左天左右,最低为右,最低为-18-18,最高为,最高为3030,波动较大。有几个订单相对异,波动较大。有几个
18、订单相对异常,需分析原因。常,需分析原因。输出图表输出图表:通过点图通过点图, ,可以看出过程中异常状态的数据可以看出过程中异常状态的数据. . 点图点图Dot plotDot plot异常点异常点这几单发生了什这几单发生了什么事情?么事情?图形图形 点图点图箱线图箱线图Box plotBox plot通过对通过对A A0101采购订单采购订单例子的分析例子的分析, ,做出来做出来A A类产品材料采购订单的分布图类产品材料采购订单的分布图, ,利用利用 Box PlotBox Plot对订单执行情况的变动对订单执行情况的变动进行分析进行分析q 对数据的中位数、波动、倾向都很容易看出来对数据的中
19、位数、波动、倾向都很容易看出来q 利用变量功能的话,集团之间的变动也容易区分出来利用变量功能的话,集团之间的变动也容易区分出来图形图形 箱线图箱线图箱线图箱线图Box plotBox plot图形图形 箱线图箱线图点击点击箱线图箱线图Box plotBox plot通过通过 Box plotBox plot可以看出:可以看出:50%50%的订单集中在基本的订单集中在基本集中在集中在-6-6和和6 6之间左右之间左右出现了异常点出现了异常点Box plotBox plot的数据数量在的数据数量在1010以下时很容易失去有效性!以下时很容易失去有效性! 箱线图箱线图的理解的理解注:注:箱子的高度箱
20、子的高度内四分位极差内四分位极差IQR Inter Quartile Range Q3-Q1 *异常点异常点 75%数数(3/4分位分位)Q3Q1MaxMinimum, Q1 - 1.5 IQRQ3 + MinMaximum, Q3 + 1.5 IQR 25%的数的数(1/4分位分位)Q1中位数中位数(1/2分位分位)Q2数据的中间数据的中间50%50%( (箱子的高度箱子的高度) )数据由小到大排列数据由小到大排列HistogramHistogram直方图直方图q 主要应用在了解数据的形状及形态主要应用在了解数据的形状及形态q 便于掌握数据的集中倾向、位置、平均、分布等便于掌握数据的集中倾向
21、、位置、平均、分布等通过对通过对A A0101采购订单采购订单例子的分析,作出例子的分析,作出A A类产品材料采购订单的倾向、位置、平均、类产品材料采购订单的倾向、位置、平均、分布等,利用直方图进行分析分布等,利用直方图进行分析 图形图形 直方图直方图直方图的制作必须要直方图的制作必须要有有5050个以上的数据。个以上的数据。HistogramHistogram直方图直方图图形图形 直方图直方图点击点击输出图表分析输出图表分析: :直方图的形态直方图的形态HistogramHistogram直方图直方图3020100-10-20121086420A A类类产产品品差差值值频频率率A A类类产产
22、品品差差值值 的的直直方方图图下面四个直方图是同样数据形成的,它的形状下面四个直方图是同样数据形成的,它的形状受柱子个数和间距的影响受柱子个数和间距的影响581015随 着 区 间随 着 区 间的调整的调整, ,数数据 的 形 状据 的 形 状分 布 不 尽分 布 不 尽相同相同直 方 图 可直 方 图 可掌 握 数 据掌 握 数 据的 分 布 、的 分 布 、居 中 趋 势居 中 趋 势等等HistogramHistogram直方图直方图如何掌握图表分析如何掌握图表分析通过图表分析可掌握通过图表分析可掌握 通过通过Descriptive StatisticsDescriptive Stati
23、stics确认了数据的平均值,确认了数据的平均值,标准差,倾斜度,陡峭度,置信区间,数据的正态分布,标准差,倾斜度,陡峭度,置信区间,数据的正态分布,还有四分位数;还有四分位数;通过通过Dot plotDot plot的图表分析,可确认全体数据平均值的的图表分析,可确认全体数据平均值的倾向、异常点及分布;倾向、异常点及分布;通过通过Box plotBox plot的图表分析,可确认全体数据中位数值的图表分析,可确认全体数据中位数值的位置、异常点及分布;的位置、异常点及分布;通过直方图可掌握全体数据的形态。通过直方图可掌握全体数据的形态。 某公司为了改进采购计划的准确性,减小材料采购不准某公司为
24、了改进采购计划的准确性,减小材料采购不准确造成生产和库存方面的压力,收集了确造成生产和库存方面的压力,收集了2 2月份月份B B类产品材料采类产品材料采购订单的数据进行分析,以找出需要改进的重点。下列数据购订单的数据进行分析,以找出需要改进的重点。下列数据是在是在2 2月份统计的各种材料订单计划时间和实际入库时间的差月份统计的各种材料订单计划时间和实际入库时间的差值值( (单位天单位天) )。试问:试问:1.B1.B类产品材料采购订单计划时间和实际入库时间的均值及标类产品材料采购订单计划时间和实际入库时间的均值及标准偏差分别为多少?从分布图中能看到什么问题?准偏差分别为多少?从分布图中能看到什
25、么问题?2.2.做出做出dot plot/box plotdot plot/box plot及直方图并解释。及直方图并解释。数据文件:数据文件:A01-采购订单采购订单.mtw练习时间:练习时间:10分钟分钟练习一练习一通过图表分析比较单个变量分布通过图表分析比较单个变量分布 我们在做项目的过程中,经常会碰到这种情况:要对我们在做项目的过程中,经常会碰到这种情况:要对两类或更多种类的数据进行比较分析两类或更多种类的数据进行比较分析 例如例如: :通过通过图表分析图表分析很容易理解不同工序加工同一位很容易理解不同工序加工同一位置尺寸的差别,不同型号刀具加工寿命之间的差别,不同置尺寸的差别,不同型
26、号刀具加工寿命之间的差别,不同员工加工能力之间的差别。那么对多个数据进行比较时经员工加工能力之间的差别。那么对多个数据进行比较时经常使用哪些图表常使用哪些图表现在通过具体事例,利用图表分析比较分布现在通过具体事例,利用图表分析比较分布Box plot用于数据间的分布差异、中位数和波动大小的比较用于数据间的分布差异、中位数和波动大小的比较利用利用A A0101采购订单采购订单例子,对两大例子,对两大类产品材料订单执行情况进行比较,类产品材料订单执行情况进行比较,用用Box plotBox plot图表分析。图表分析。箱线图箱线图Box plotBox plot图形图形 箱线图箱线图箱线图箱线图B
27、ox plotBox plot图形图形 箱线图箱线图点击点击输出图表分析输出图表分析箱线图箱线图Box plotBox plotB类产品差值A类产品差值3020100-10-20-30类类别别差差值值差差值值 的的箱箱线线图图两类产品的订单两类产品的订单执行情况没有明执行情况没有明显的差异,显的差异,B B类类产品订单执行情产品订单执行情况的波动大于况的波动大于A A类产品。类产品。q单因素多组数据点图单因素多组数据点图-Multiple Dot Plot-Multiple Dot Plot显示多个过程的平均值倾向、变动、分布显示多个过程的平均值倾向、变动、分布可比较两个或两个以上数据间的差别
28、可比较两个或两个以上数据间的差别利用利用A A0101采购订单采购订单例子对两大例子对两大类产品材料订单执行情况进行比较,类产品材料订单执行情况进行比较,平均值的倾向、变动及分布进行平均值的倾向、变动及分布进行Multiple Dot plotMultiple Dot plot对比分析对比分析 点图点图Dot plotDot plot图形图形 点图点图点图点图Dot plotDot plot图形图形 点图点图点击点击通过通过Dot plotDot plot可以可以看出两类产品的材看出两类产品的材料采购订单执行情料采购订单执行情况没有明显的差异。况没有明显的差异。Multiple Dot plo
29、tMultiple Dot plot的分布在数据很多的分布在数据很多的时候很容易看出的时候很容易看出两个或多个分布的两个或多个分布的区别区别点图点图Dot plotDot plot输出图表分析输出图表分析241680-8-16-24A类 产 品 差 值B类 产 品 差 值差差值值类类别别差差值值 的的点点图图单个变量分布的构成单个变量分布的构成目的目的: :确定某些特定事件在整个事件中所占的比例或者问题确定某些特定事件在整个事件中所占的比例或者问题主要集中在哪些方面主要集中在哪些方面? ?我们想知道以下问题我们想知道以下问题 例如例如:1.:1.发动机缺陷集中在哪些方面发动机缺陷集中在哪些方面
30、? ? 2. 2.顾客反馈的意见主要集中在哪些方面顾客反馈的意见主要集中在哪些方面? ? 3. 3.成本浪费主要集中在哪里成本浪费主要集中在哪里. .通过变量分布构成的分析我们就可以解决以上问题通过变量分布构成的分析我们就可以解决以上问题柏拉图柏拉图Pareto chartPareto chart统计统计 质量工具质量工具 Pareto Pareto 图图 确定不良品、缺陷数、争议点、事故的现象或原因等集确定不良品、缺陷数、争议点、事故的现象或原因等集中在哪些方面,掌握主要的问题点(中在哪些方面,掌握主要的问题点(80/2080/20原则)原则)打开文件打开文件: :A A0202费费用用.M
31、TW.MTW利用利用柏拉图柏拉图进行分进行分析析柏拉图柏拉图Pareto chartPareto chart统计统计 质量工具质量工具 Pareto Pareto 图图 费用950245165125765825百分比57.814.910.07.64.63.51.5累积 %57.872.782.790.395.098.5100.0类别其他营业员培训费店面装修会展费用业务咨询市场调研费广告费180016001400120010008006004002000100806040200费费用用百百分分比比类类别别 的的 P Pa ar re et to o 图图广告费的支出广告费的支出占大头占大头饼图饼
32、图Pie chartPie chart 主要用于对原因或现象的构成比例进行分析,掌握某主要用于对原因或现象的构成比例进行分析,掌握某种现象在过程中的构成比例。种现象在过程中的构成比例。打开文件打开文件: :A A0202费用费用.MTW.MTW利利用用饼图饼图进行分析进行分析图形图形 饼图饼图饼图饼图Pie chartPie chart图形图形 饼图饼图点击点击广告费场地租赁费会展费用营业员培训费市场调研费店面装修业务咨询类别业务咨询165, 10.0%店面装修76, 4.6%市场调研费245, 14.9%营业员培训费58, 3.5%会展费用125, 7.6%场地租赁费25, 1.5%广告费9
33、50, 57.8%类类别别 的的饼饼图图利用利用饼图饼图很容易知道各个类别在全体很容易知道各个类别在全体中所占的比率中所占的比率饼图饼图Pie chartPie chart利用图表分析对分布进行比较利用图表分析对分布进行比较到目前为止通过分布比较及构成比较分析得出到目前为止通过分布比较及构成比较分析得出通过通过Box plotBox plot可以对不同数据的偏差可以对不同数据的偏差, ,中心位置和离散程度中心位置和离散程度进行确认进行确认通过通过Multiple Dot plotMultiple Dot plot可以确认各数据间分布展开的程度可以确认各数据间分布展开的程度及异常点及异常点通过通
34、过Pareto chartPareto chart把少数核心问题用图表更容易地表现出来把少数核心问题用图表更容易地表现出来通过通过Pie chartPie chart可以确认该项目在全体中所占的构成比可以确认该项目在全体中所占的构成比请用的数据做以下分析请用的数据做以下分析1.1.不同型号的加工尺寸有什么区别?不同型号的加工尺寸有什么区别?2.2.不同操作员的加工尺寸有什么区别?不同操作员的加工尺寸有什么区别? 数据文件:数据文件:A A加工尺寸加工尺寸.mtw.mtw3.3.不同型号的缺陷构成如何?不同型号的缺陷构成如何?4.4.不同缺陷类型的缺陷构成如何?不同缺陷类型的缺陷构成如何? 数据
35、文件:数据文件:A A产品缺陷产品缺陷.mtw.mtw练习二练习二两个变量间关系两个变量间关系利用一些时间看一下利用一些时间看一下MINITABMINITAB提供的图表有哪些技能提供的图表有哪些技能q 在许多情况下当在许多情况下当两个因素或一个因素与两个因素或一个因素与Y Y有密有密切关系时,把它们作成一个图表,更容易知道问切关系时,把它们作成一个图表,更容易知道问题点的所在题点的所在q 另外,随着时间有什么变化另外,随着时间有什么变化( (周期或倾向周期或倾向) ),可,可以推测其产生问题的原因以推测其产生问题的原因相关分析相关分析目的目的: :分析输入变量分析输入变量(X)(X)之间或者输
36、入变量之间或者输入变量(X)(X)和输出变量和输出变量(Y)(Y)之间的相关关系,为我们深入分析它们之间的函数关系奠定之间的相关关系,为我们深入分析它们之间的函数关系奠定了基础。了基础。 我们想知道以下问题我们想知道以下问题例如例如: :1.1.广告费用和销售额之间有什么关系?广告费用和销售额之间有什么关系? 2.2.用户的消费与其收入、年龄有什么关系用户的消费与其收入、年龄有什么关系 . 通过相关分析我们就可以解决以上问题。通过相关分析我们就可以解决以上问题。 相关关系相关关系相关关系可以用数据来看出两个变量相关关系可以用数据来看出两个变量(Y(Y与与X,X,或两个或两个X)X)间紧间紧密程
37、度如何。两者之间关系的强度通过相关系数密程度如何。两者之间关系的强度通过相关系数(r)(r)计数化计数化 -1.0-1.0 0 0 +1.0+1.0 负的相关系负的相关系 正的相关关系正的相关关系 没有相关关系没有相关关系 决定点决定点r值值 r 接近 -1 r 接近 +1(+) (+) 正的相关关系正的相关关系( ( ) ) 负的相关关系负的相关关系接近接近0 0时几乎没有相关关系时几乎没有相关关系相关性的分类相关性的分类弱的正相关弱的正相关 弱的负相关弱的负相关 强的正相关强的正相关 强的负相关强的负相关 其它关系其它关系没有相关关系没有相关关系相关关系图相关关系图示示相关性的判断原则跟样
38、本容量有很大的关系相关性的判断原则跟样本容量有很大的关系 如果样本容量大于如果样本容量大于9 9,相关系数达到,相关系数达到0.70.7时,我们就认为时,我们就认为两个变量之间确实存在相关性;两个变量之间确实存在相关性; 如果样本容量大于如果样本容量大于1515,相关系数达到,相关系数达到0.50.5时,我们就认时,我们就认为两个变量之间确实存在相关性;为两个变量之间确实存在相关性; 如果样本容量大于如果样本容量大于2525,相关系数达到,相关系数达到0.40.4时,我们就认时,我们就认为两个变量之间确实存在相关性。为两个变量之间确实存在相关性。相关性的判断基准相关性的判断基准事例分析事例分析
39、利用利用A A0303销售能力销售能力分析销售人员销售额与其销售经验等因分析销售人员销售额与其销售经验等因素之间的关系素之间的关系统计统计 基础统计量基础统计量 相关相关相关的滥用与误用相关的滥用与误用q 即使证明即使证明Y Y与与X X间具有相关关系,也并不意味着间具有相关关系,也并不意味着Y Y的变动一的变动一定是定是X X的变动引起的,即两个变量间有相关关系并不意味的变动引起的,即两个变量间有相关关系并不意味着必然有因果关系着必然有因果关系, ,可能存在引起可能存在引起X X与与Y Y同时变动的第同时变动的第3 3个个隐藏变量。隐藏变量。要想真正了解变量之间的因果关系,有必要要想真正了解
40、变量之间的因果关系,有必要进行试验设计分析。进行试验设计分析。q 相关分析主要考察两个变量之间是否存在相关分析主要考察两个变量之间是否存在线性线性的相关关的相关关系。相关系数接近系。相关系数接近“0”0”表示两个变量间直线关系弱,并表示两个变量间直线关系弱,并不意味着两个变量间没有关系。不意味着两个变量间没有关系。散点图散点图Scatter plotScatter plot利用利用A A0303销售能力销售能力画出散点图,画出散点图,以便直观判断销售经验与销售额之间以便直观判断销售经验与销售额之间的关系的关系q主要用于评价主要用于评价两因素间两因素间的相互关系,在视觉上判断因素之的相互关系,在
41、视觉上判断因素之间的关系间的关系q两因素的数据分布的密集度及相关性两因素的数据分布的密集度及相关性图形图形 散点图散点图 散点图散点图Scatter plotScatter plot图形图形 散点图散点图 点击点击从视觉上可以从视觉上可以看出,销售额看出,销售额与销售经验之与销售经验之间有较密切的间有较密切的正相关关系,正相关关系,即销售经验越即销售经验越多,其销售额多,其销售额越高。越高。散点图散点图Scatter plotScatter plot50403020100900000800000700000600000500000400000300000200000100000销销售售经经验验
42、销销售售额额销销售售额额 与与 销销售售经经验验 的的散散点点图图边际图边际图Marginal plotMarginal plot图形图形 边际图边际图q从视觉从视觉可以知道可以知道两个因素两个因素之间关系之间关系q直方图和相关图同时出现在视觉上,更容易知道分布的倾向直方图和相关图同时出现在视觉上,更容易知道分布的倾向利用利用A A0303销售能力销售能力对销售额与资对销售额与资历的关系进行图表分析历的关系进行图表分析边际图边际图Marginal plotMarginal plot图形图形 边际图边际图点击点击5040302010800000600000400000200000资资历历销销售售
43、额额销销售售额额 与与 资资历历 的的边边际际图图确认销售额与资历的关系,在这个图上即可以看出确认销售额与资历的关系,在这个图上即可以看出两因素间的关系,也可以了解单个变量的分布。两因素间的关系,也可以了解单个变量的分布。边际图边际图Marginal plotMarginal plot运用边际图运用边际图在散点图里在散点图里画出直方图画出直方图矩阵图矩阵图Matrix plotMatrix plotq 应用于比较应用于比较多个因素多个因素间的相互关系间的相互关系q 与与Scatter PlotScatter Plot相比较更适用于多个因素一起比较相比较更适用于多个因素一起比较利用利用A A03
44、03销售能力销售能力例子对资历、例子对资历、年龄、受教育程度、销售经验之间的年龄、受教育程度、销售经验之间的关系进行关系进行Matrix plotMatrix plot分析分析 图形图形 矩阵图矩阵图矩阵图矩阵图Matrix plotMatrix plot图形图形 矩阵图矩阵图点击点击9000006000003000005030104020040302040200847260403020900000600000300000503010847260销销售售额额销销售售经经验验受受教教育育程程度度年年龄龄资资历历销销售售额额, , 销销售售经经验验, , 受受教教育育程程度度, , 年年龄龄, ,
45、 资资历历 的的矩矩阵阵图图利用矩阵图可以在图表利用矩阵图可以在图表里看出全部因素间的关里看出全部因素间的关系系销售经验、资历与消费之间均有很强的相关关销售经验、资历与消费之间均有很强的相关关系,而受教育程度和年龄则与销售额之间没有系,而受教育程度和年龄则与销售额之间没有显著的相关关系显著的相关关系矩阵图矩阵图Matrix Matrix plotplot时间序列图时间序列图Time Series plotTime Series plotq 随时间的变化对观测值进行推测及排列,主要使随时间的变化对观测值进行推测及排列,主要使用用Time series plotTime series plot进行
46、分析进行分析图形图形 时间序列图时间序列图时间序列图时间序列图分析是对未来数据的倾向或周期的一种分析方法分析是对未来数据的倾向或周期的一种分析方法受时间影响的数据叫受时间影响的数据叫Time SeriesTime Series数据,先画出图表,掌数据,先画出图表,掌握大概的握大概的Time SeriesTime Series数据形态后,对受时间变化影响较数据形态后,对受时间变化影响较大的数据进行分析大的数据进行分析收集收集Time SeriesTime Series资料资料设定统计模型设定统计模型未来成果未来成果时间序列数据的形态时间序列数据的形态时间序列数据的各种类型时间序列数据的各种类型t
47、yt偶然变动偶然变动( (Random Variation)Random Variation)平均在一定水准时,平均在一定水准时,只显示偶然变动的变化只显示偶然变动的变化tyt随时间变化的数据随时间变化的数据, ,反复于一定的周期反复于一定的周期季节变动季节变动( (Seasonal Variation)Seasonal Variation)tyt显示出数据随时间变化的形态显示出数据随时间变化的形态倾向是线形还是二次型倾向是线形还是二次型tyt倾向变动倾向变动( (Trend Variation)Trend Variation)政策的变化政策的变化, ,市场变化对数据市场变化对数据的影响的影响
48、, ,反映出的变动反映出的变动其它变动其它变动 利用利用Minitab Minitab 图表分析方法图表分析方法( (时间序列数据分析时间序列数据分析) )对以对以上数据进行趋势分析上数据进行趋势分析打开数据文件打开数据文件: : A A0404销售额销售额.MTW.MTW事例分析事例分析 某区域经理为了了解某一个销售网点每月销售额的变某区域经理为了了解某一个销售网点每月销售额的变化情况,每月收集了该网点销售额的数据,希望从中找出化情况,每月收集了该网点销售额的数据,希望从中找出变化的规律。变化的规律。 为此收集了为此收集了20052005年年1 11212月的数据,通过时间序列图月的数据,通
49、过时间序列图来了解销售额的变化情况。来了解销售额的变化情况。时间序列图时间序列图Time Series plotTime Series plot图形图形 时间序列图时间序列图点击点击1211109876543212500020000150001000050000指指数数销销售售额额销销售售额额 的的时时间间序序列列图图利用时间序列图利用时间序列图进行分析进行分析, ,很容易很容易确认长期的趋势确认长期的趋势指标呈稳定的趋势,但指标呈稳定的趋势,但5 5月份和月份和1010月份的突变值得研究?月份的突变值得研究?时间序列图时间序列图两因素间关系及时间序列图分析两因素间关系及时间序列图分析q 到目
50、前为止通过图表分析可以从视觉上判断因素间的到目前为止通过图表分析可以从视觉上判断因素间的关系是怎样的关系是怎样的 通过通过Scatter plotScatter plot分析因素间的相关关系;分析因素间的相关关系; 通过通过Marginal plotMarginal plot可同时分析因素之间的关系及可同时分析因素之间的关系及分布;分布; 通过通过Matrix plotMatrix plot可同时分析多个因素间关系;可同时分析多个因素间关系; 通过通过Time series plotTime series plot可分析某因素随时间变化可分析某因素随时间变化的倾向。的倾向。 A A0303客户