《管理资料-其它管理→统计分析方法介绍.ppt》由会员分享,可在线阅读,更多相关《管理资料-其它管理→统计分析方法介绍.ppt(70页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 统计分析方法介绍二零零四年元月 主要内容一,区间估计二,假设检验三,ANOVA四,回归分析(比较相关分析)区间估计的主要内容区间估计的基本步骤置信水平总体平均值的区间估计(点估计)区间估计 1,基本步骤确定一个与检验参数相关的统计量及其分布确定置信水平 1-a置信水平(置信度):样本统计量反映总体特性的水平,显著性水平,记为 a根据统计量的分布和置信水平确定置信区间区间估计 2,置信水平例:以下是对总体平均值进行区间估计时,样本平均值样本平均值的分布结果解释:(a,b)总体平均值置信水平为95的置信区间区间估计 3,总体平均值的区间估计与总体平均值相关的统计量样本平均值样本平均值的分布总体特
2、性分布 XN(,2)样本平均值的分布(n:sample size)Sigma 已知 XN(,2/n)Z=n1/2(X-)/N(0,1)Sigma 未知 XN(,2/n)t=n1/2(X-)/st(n-1)总体平均值的置信区间Sigma 已知 ZaZZ1-a X+Za n-1/2 X+Z1-a n-1/2Sigma 未知 tatt1-a X+ta s n-1/2 u2 H1:u1 u2 3,H0:u1u2 H1:u1 u2与区间估计一致假设检验 2,两类风险第一类风险(生产方风险)当H0成立时,拒绝H0的概率第二类风险(使用方风险)当H0不成立时,接受H0的概率势(power)第一类风险与置信水
3、平假设检验 3,平均值的假设检验1,检验总体平均值是否等于指定值u02,原假设和对立假设:H0 U=u0 H1 Uu0 3,检验统计量及其分布:t=n1/2(X-u0)/s4,临界值和拒绝域:t:t t1-a or t t or T-t)假设检验 3,平均值的假设检验假设检验 3,平均值的假设检验假设检验 3,平均值的假设检验假设检验 3,平均值的假设检验假设检验 3,平均值的假设检验MINNTAB中假设检验路径及数据格式假设检验 3,平均值的假设检验假设检验1-sample Z-test1-sample t-testSelect data sourceInput tested meansIn
4、put known sigmaSelect data sourceInput tested means.(.),.3,平均值的假设检验Two-sample T-test假设检验1,data in one column2,data in two columns.(.),.3,平均值的假设检验Paired T-test假设检验.(.),.3,平均值的假设检验Option in hypothesis假设检验Graph in hypothesisAlternative hypothesis(H1).(.),.4,标准差的假设检验1,检验两组数据的标准差是否相等2,原假设和对立假设:H0 1=2 H1
5、12 3,标准:时,两组数据的标准差相等4,Path in MINITAB:StatBasic statisticsVariances假设检验.(.),.5,正态分布的假设检验定义:检验一组数据是否服从正态分布假设:H0:正态分布H1:非正态分布标准:时,数据为非正态分布正态概率图计算平均值,标准差将数据从小到大排序,计算各数据对应的累积分布概率描点(注意纵轴的刻度)Path in MINITAB:StatBasic statisticsNormality test假设检验.(.),.5,正态分布的假设检验正态分布下的直方图和正态概率图假设检验.(.),.5,正态分布的假设检验非正态分布下的直
6、方图和正态概率图假设检验.(.),.5,正态分布的假设检验在数据不服从正态分布时,采用Box-Cox变换改变数据的分布形状Box-Cox变换 YY(Path:Statcontrol chartsBox-Cox transformation)假设检验.(.),.6,合格率的假设检验类型一批产品合格率是否小于P二批产品合格率是否相等例1,从生产产品中抽出2000进行检查,52不合格,合格率是否小于98?2,从一条生产线抽出1500产品检查,17不合格;从另一条生产线抽出1300产品检查,25不合格;它们的合格率是否一样?假设检验.(.),.6,合格率的假设检验Proportion test in
7、MINITABProportion test for one groupProportion.parison between two groups假设检验.(.),.6,合格率的假设检验例 1(Proportion test for one group)输入检查结果输入检验对比合格率选择假设类型假设检验.(.),.6,合格率的假设检验Test and CI for One ProportionTest of vs ExactSample X N Sample p 95.0%Upper Bound P-Value1 1948 2000 0.974000 0.979580 例 1(Proporti
8、on test for one group)P0.05,判断结果合格率相等。假设检验.(.),.7,离散性数据相关性检验例-缺陷严重度(数量)与加工速度关系MINITAB:stattableschi-square test时,两个变量间有强的相关性。缺陷速度 轻微一般严重快30148一般402912慢26157假设检验.(.),.7,离散性数据相关性检验Chi-Square Test:C1,C2,C3Expected counts are printed below observed counts C1 C2 C3 Total 1 30 14 8 52 2 40 29 12 81 3 26 1
9、5 7 48Total 96 58 27 181Chi-Sq=0.212+0.426+0.008+0.204+0.357+0.001+DF=4,P-Value=Chi-square Test 检验结果检验结果P0.05,缺陷严重度与速度没有相关关系。假设检验.(.),.8,势(power),样本大小,差异计算假设检验 假设检验判别力假设检验判别力-当检验对象与原假设不同时,当检验对象与原假设不同时,检验方法进行正确判别的能力,又称功效检验方法进行正确判别的能力,又称功效(power),计算为计算为 1-。例:对两个不同的总体,其样本平均值的分布例:对两个不同的总体,其样本平均值的分布N(,2/
10、n)N(,2/n)拒绝域拒绝域(风险)接受域接受域(风险)t.(.),.8,势(power),样本大小,差异计算与假设检验判别力(功效)相关的因素:样本大小可接受的差异假设检验判别力,样本大小,检出差异相互关系及计算三者中任何两个可确定另外一个样本多,允许差异大时,判别力高例假设检验.(.),.8,势(power),样本大小,差异计算计算对应检验的功效MINITAB 应用假设检验.(.),.8,势(power),样本大小,差异计算MINITAB 应用(Two sample t-test)1,先确定标准差2,sample size,power,difference,可以根据其中任意二个确定另外一
11、个。假设检验.(.),.8,势(power),样本大小,差异计算Power and Sample Size2-Sample t TestTesting mean 1=mean 2(versus not=)Calculating power for mean 1=mean 2+differenceAlpha=0.05 Sigma=1 SampleDifference Size Power 0.5 30 MINITAB 应用(Power value in two sample t-test)假设检验.(.),.8,势(power),样本大小,差异计算MINITAB 应用(Sample size i
12、n two sample t-test)Power and Sample Size2-Sample t TestTesting mean 1=mean 2(versus not=)Calculating power for mean 1=mean 2+differenceAlpha=0.05 Sigma=1 Sample Target ActualDifference Size Power Power 0.5 86假设检验.(.),.8,势(power),样本大小,差异计算MINITAB 应用(Difference in two sample t-test)Power and Sample S
13、ize2-Sample t TestTesting mean 1=mean 2(versus not=)Calculating power for mean 1=mean 2+differenceAlpha=0.05 Sigma=1Sample Size Power Difference 30 0.9000 假设检验.(.),.ANOVA1,实例-Swage ball size optimize evaluation2,原理3,ANOVA in MINITABANOVA.(.),.1,实例-介绍例-Swage ball size optimize evaluation响应变量(Response
14、):gramload因子/水平(Factor/level):1,swage ball size(79/80/81mil,79/80.5/81.5mil,79/81/82mil,79/81.5mil)2,Heads(HD2,HD3)试验次数:20*8=160平衡设计方差分析(two-way)MINITAB:StatANOVAANOVA.(.),.1,实例-方差分析表Two-way ANOVA:Gramload versus Head,GroupAnalysis of Variance for GramloadSource DF SS MS F PHead 1 0.02889 9.10 Group
15、 3 0.23875 0.07958 25.08 Interaction 3 0.05986 0.01995 6.29 时,有显著性影响。误差来源ANOVA.(.),.1,实例-置信区间估计 Individual 95%CIHead Mean -+-+-+-+-HD2 2.5700 (-*-)HD3 2.5431 (-*-)-+-+-+-+-Individual 95%CIGroup Mean -+-+-+-+-Group 1 2.6173 (-*-)Group 2 2.5628 (-*-)Group 3 2.5255 (-*-)Group 4 2.5208 (-*-)-+-+-+-+-ANO
16、VA.(.),.1,实例-平均值分布图ANOVA.(.),.1,实例-平均值置信区间分布ANOVA.(.),.1,实例-交互作用分布图ANOVA.(.),.2,原理方差分解SST=SSA+SSB+SSAxB+SSE与随机误差比较,确定因子的显著性SSESSAxBSSASSBANOVA.(.),.3,ANOVA in MINITAB方差分析图形方差分析图形数据格式数据格式ANOVA.(.),.3,ANOVA in MINITABANOVA.(.),.3,ANOVA in MINITAB(One-way)数据格式数据格式ANOVA.(.),.3,ANOVA in MINITAB(One-way-s
17、tacked)数据格式数据格式ANOVA.(.),.3,ANOVA in MINITAB(Two-way)数据格式数据格式ANOVA.(.),.3,ANOVA in MINITAB(Balanced ANOVA)interactionuncontrolledANOVA.(.),.3,ANOVA in MINITAB(General Linear Model)ANOVA.(.),.3,ANOVA in MINITAB(Fully Nested ANOVA)ANOVA.(.),.回归分析的主要内容实例最小二乘原理显著性检验预测值和预测区间回归诊断MINITAB应用相关分析回归分析.(.),.1,实
18、例(y=ax+b)回归分析.(.),.2,最小二乘原理原理Min(Ei)2=min(Yi Yi)2相关指数R2=1-(Ei)2/(Yi Y)2比较相关性系数回归分析.(.),.3,显著性检验Regression Analysis:MSP versus KaifaThe regression equation isMSP=-0.360+1.44 KaifaPredictor Coef SE Coef T PKaifaS=0.002351 R-Sq=72.9%R-Sq(adj)=72.0%回归分析常数是否为零系数是否为零.(.),.3,显著性检验Analysis of VarianceSource
19、 DF SS MS F PRegression 1 0.00044631 Unusual ObservationsObs Kaifa MSP Fit SE Fit Residual St Resid 23 0.819 0.823000 0.818041 0.000420 0.004959 2.14R R denotes an observation with a large standardized residualX denotes an observation whose X value gives it large influence.回归分析.(.),.4,预测值和预测区间回归分析.(
20、.),.5,回归诊断线性模型-Plot(residual,fit)误差独立性-Plot(residual,observed order)误差正态性-Histogram,Normal plot回归分析.(.),.5,回归诊断回归分析.(.),.6,MINITAB应用回归分析可以选择多个变量.(.),.6,MINITAB应用残差分布图形预测值及预测区间回归分析.(.),.7,相关分析相关分析与回归分析差别相关分析中的变量是随机变量随机变量,回归分析中的变量是非随机变量非随机变量;相关分析中的变量是相互联系的相互联系的,回归分析中一个变量一个变量(自变量自变量)由另一个变量由另一个变量(因变量因变量)引起引起。相关分析是分析两个变量两个变量的线性关系线性关系,回归分析呈以分析一个变量和多个变量一个变量和多个变量的线性关线性关系系和非线性关系非线性关系。回归分析.(.),.7,相关分析相关分析与回归分析联系相关系数(相关分析)与相关指数(一元回归分析)计算结果一样;相关方程与回归方程的建立建立方法一样;相关方程与回归方程的诊断诊断方法一样;回归分析.(.),.