《回归分析(Regression).pdf》由会员分享,可在线阅读,更多相关《回归分析(Regression).pdf(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Copyright 2008,SAS Institute Inc.All rights reserved.质量统计应用方法回归分析JMP中国区Copyright 2008,SAS Institute Inc.All rights reserved.内容摘要内容摘要?公司简介及JMP入门(略)?回归分析的基本概念?回归模型的建立?回归模型的诊断?回归模型的用途?回归分析的综合应用案例?交流与问答Copyright 2008,SAS Institute Inc.All rights reserved.如何鉴定流程能力的优劣?LSLUSLTargetCopyright 2008,SAS Instit
2、ute Inc.All rights reserved.传统控制阶段(传统控制阶段(QC,quality control)统计质量控制阶段(统计质量控制阶段(SQC,statistical quality control)全面质量管理阶段(全面质量管理阶段(TQM,totalquality management)六西格玛质量管理阶段(六西格玛质量管理阶段(Six Sigma Management)1900 1930 1950 1990质量管理的发展Copyright 2008,SAS Institute Inc.All rights reserved.JMP是什么??SAS公司的软件事业部?名
3、字源于 Johns Macintosh Program?JMP软件,众多世界知名学府和企业、超过200,000名用户的选择?功能强大、使用简单的专业统计质量分析软件Copyright 2008,SAS Institute Inc.All rights reserved.2008 全球绩效30余年持续增长,08年营业收入达到22.6亿美金Copyright 2008,SAS Institute Inc.All rights reserved.全球最优秀的行业领袖信赖JMPCopyright 2008,SAS Institute Inc.All rights reserved.JMP 让数据分析更
4、轻松1.功能强大的数据分析能力2.卓越的可视化效果3.简单易懂的操作方式Copyright 2008,SAS Institute Inc.All rights reserved.统计分析能力基本统计基本统计描述性统计单样本、双样本t检验配对t检验相关和协方差单样本方差、等方差检验正态分布的拟合与检验其他主要分布的拟合与检验回归分析回归分析线性回归多项式回归多元回归逐步和最佳子集回归Logistic 回归偏最小二乘法非线性回归响应面回归正交回归置信区间和预测区间方差分析方差分析一般方差分析Welch 方差分析协方差分析广义线性模型多元方差分析非平衡方差分析嵌套方差分析平均值分析环图多重比较列联表
5、列联表卡方分析对应分析Cochran Mantel Haenszel 检验模型拟合模型拟合分段拟合样条拟合随机效应模型混合模型统一尺度估计对数方差反向预测Box Cox 转换参数功效定制检验时间序列分析时间序列分析自相关、偏自相关、交叉相关ARIMA 分析季节性 ARIMA 分析平滑模型Winter 法谱密度分析预测多元分析多元分析主成分分析因子分析密度椭圆聚类分析判别分析项目分析对应分析联合分析仿真仿真随机数据生成器随机噪声多元随机变量随机抽样与建模密切整合非参数分析非参数分析Wilcoxon 检验中位数检验Van Der Waerden 检验Kruskal-Wallis 检验统计量Spea
6、rman Rho统计量Kendall Tau统计量Hoeffding D样本数量和功效样本数量和功效单样本、双样本和多样本的均值单样本的方差单样本、双样本的比例泊松分布注:蓝色为其他统计软件所不具备的功能Copyright 2008,SAS Institute Inc.All rights reserved.统计分析能力统计过程控制统计过程控制运行图变量控制图属性控制图特殊原因检验操作特性曲线时间加权控制图多变量控制图Levey Jennings控制图实时控制图过程能力分析测量系统分析测量系统分析变异源分析量具的重复性和再现性量具的偏倚和线性嵌套型量具分析交叉嵌套混合的量具分析属性一致性分析K
7、appa判别比率可区分类别数试验设计试验设计完全因子设计筛选设计响应面设计混料设计田口设计扩充设计空间填充设计非线性设计定制设计生存生存/可靠性分析可靠性分析分布拟合WeiBayes 分析竞争原因估计参数生存模型非线性参数生存模型比例危险模型加速失效模型可修复系统的再现分析数据挖掘数据挖掘:决策树,神经网络注:蓝色为其他统计软件所不具备的功能Copyright 2008,SAS Institute Inc.All rights reserved.JMP中的可视化方式动画演示动画演示数据与图形的交互数据与图形的交互专业图形专业图形?拒绝枯燥,生动演绎统计学原理?真正实现动态链接,瞬间揭示事实真相
8、项目管理项目管理?融项目管理和数据分析为一体,提高工作效率?JMP提供最专业的统计分析图形:种类、效果、可读性Copyright 2008,SAS Institute Inc.All rights reserved.JMP中的图形种类饼图、折线图、条形图;直方图、箱型图;散点图、3D散点图、散点图矩阵;运行图、时间序列图分位数图、茎叶图、CDF图;Pareto 图、鱼骨图;贝叶斯图;立方图;等高线图、曲面图、三元图;刻画器、定制刻画器;平行图、方格图、树图;拼花图;OC 曲线;泡泡图;?Seeing is believing!Copyright 2008,SAS Institute Inc.A
9、ll rights reserved.JMP 使用界面根据用户要求根据用户要求层层递进层层递进Copyright 2008,SAS Institute Inc.All rights reserved.JMP数据表控制面板数据网格控制面板数据网格列列=变量变量行行=记录记录表表=数据库数据库展开列菜单展开行菜单隐藏/撤消隐藏控制面板Copyright 2008,SAS Institute Inc.All rights reserved.菜单架构数据处理分析数据协助管理可视化数据Copyright 2008,SAS Institute Inc.All rights reserved.回归分析与假设
10、检验ResponseContinuousPredictorContinuousSimpleLinearRegressionCategoricalt test/ANOVACopyright 2008,SAS Institute Inc.All rights reserved.回归?什么是回归?根据变量间客观存在的相关关系,建立起合适的数学模型,分析和讨论其性质和应用的统计方法?回归有什么用?量化变量(尤其是连续变量)之间的客观规律排除众多噪声因素的干扰,找到影响流程变异/质量性能的关键因素根据少量的样本数据了解庞大的总体情况根据历史数据预测和监控流程今后长期的表现加速学习进程,高度提炼专业知识和
11、经验深入、透彻地理解流程,为批量化生产经营的标准化工作奠定基础科学客观地总结和归纳出产品设计、工艺改进的综合解决方案根据客户要求、技术标准灵活地调整现有的工艺/服务流程Copyright 2008,SAS Institute Inc.All rights reserved.回归的应用领域回归回归市场营销市场营销质量管理质量管理产品研发产品研发工艺改进工艺改进服务优化服务优化企业管理企业管理Copyright 2008,SAS Institute Inc.All rights reserved.常见的回归形式Indicator variables(for discrete Xs)xxxxxxxx
12、xxxxxxxXiYXaXbXcMultiple(2 or more Xs)Polynomial(2 or more Xs)YX1X2Simple linear (1 X)XYYX2X1Polynomial(1 X)XYLogistic (for discrete Ys)X10%yes123456Copyright 2008,SAS Institute Inc.All rights reserved.回归分析的一般过程?观察散点图?作描述性统计?线性或曲面??一元或多元??数据转换??离散型 X,离散型Y??计算参数?判定系数?显著性?残差通过?收集并了解数据?选择回归模型(假设)?模型求解?
13、模型检验?实际应用?控制输出值?通过输入值预测未通过?变量的基础分析?明确研究的对象和范围Copyright 2008,SAS Institute Inc.All rights reserved.散点图与相关系数的概念X(input)Y(output)weakSTRO NGSTRO NGCorrelation Coefficient0-11NegativePositive=22)()()(yyxxyyxxriiii=22)()()(yyxxyyxxriiiiCopyright 2008,SAS Institute Inc.All rights reserved.XYXYXYXYXYXYStro
14、ng Positive Correlation r =.95Moderate Positive Correlation r=.70No Correlation r=.006Other Pattern-No Linear Correlation r=-.29Moderate Negative Correlation r=-.73Strong Negative Correlationr=-.90散点图与相关系数的组合Copyright 2008,SAS Institute Inc.All rights reserved.ea321i一元线性回归模型YXeyb xeii=+$yab xii=+eRe
15、sidualCopyright 2008,SAS Institute Inc.All rights reserved.理论公式yi=a+bxi+eiSampleRegression EquationSample SlopeSample InterceptxbyaxxyyxxbxxySS)()(2n1i2in1iii=Copyright 2008,SAS Institute Inc.All rights reserved.回归诊断1.变差度量判定系数(R2)均方根误差(RMSE)2.显著性检验3.残差分析4.散点图分析$yab xii=+Copyright 2008,SAS Institute
16、Inc.All rights reserved.判定系数 R20 R2 1R2=Explained VariationTotal VariationSSRSST()()()()=niiniiniiniiyyyyyyyy121212121()()()()=niiniiniiniiyyyyyyyy121212121Copyright 2008,SAS Institute Inc.All rights reserved.Total Sum of Squares(yi-y)2总平方和YX yxi判决系数的图示Unexplained Sum of Squares(yi-yi)2残差平方和yi$yab x
17、ii=+Explained Sum of Squares(yi-y)2回归平方和Copyright 2008,SAS Institute Inc.All rights reserved.均方根误差22)(111212=nyxbyaySnyySnininiiiiieniiie1.实际观察值与回归估计值离差平方和的均方根2.反映实际观察值在回归直线周围的分散状况3.从另一个角度说明了回归直线的拟合程度4.计算公式为Copyright 2008,SAS Institute Inc.All rights reserved.回归系数的显著性检验1.假设H0:1=0(No Linear Relations
18、hip)H1:1 0(Linear Relationship)2.检验统计量=2)()(12xixeSbSwhere2ntbSbnt3.统计决策:If t t,refuse H0.Ift t,accept H0.Copyright 2008,SAS Institute Inc.All rights reserved.回归方程的显著性检验1.假设H0:No Linear RelationshipH1:Linear Relationship2.检验统计量()()2,1(21211212=nFnyyyynSSESSRFniinii()()2,1(21211212=nFnyyyynSSESSRFnii
19、nii3.统计决策:If F F,refuse H0.IfF F,accept H0.Copyright 2008,SAS Institute Inc.All rights reserved.残差分析Assumption Check Tool3.Residuals normally distributed Normal Plot&Histogram of Residuals2.Residual distribution stable over timeRun Chart of Residuals 4.Residuals not related to XScatterplot of Residu
20、als vs.Each X1.Residuals not related to Predicted YScatterplot of Residuals vsPredicted Y(Fits)Copyright 2008,SAS Institute Inc.All rights reserved.散点图分析Copyright 2008,SAS Institute Inc.All rights reserved.回归的应用1.根据自变量 x 的取值估计或预测因变量 y的取值2.估计或预测的类型点估计y 的平均值的点估计y 的个别值的点估计区间估计y 的平均值的置信区间估计y 的个别值的预测区间估计
21、3.平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同4.点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此有必要进行区间估计Copyright 2008,SAS Institute Inc.All rights reserved.区间估计的图示x x0 0 x x单值置信上限单值置信上限均值置信上限均值置信上限单值置信下限单值置信下限均值置信上限均值置信上限y yx xCopyright 2008,SAS Institute Inc.All rights reserved.案例学习1.影响健身效果的原因分析2.钢铁强度的提升3.婴幼儿发育趋势的调查4.食品包装重量的控制5.密封过程有效性的改善Copyright 2008,SAS Institute Inc.All rights reserved.Thank YouJMP 中国区JMP 中国区上海市浦东南路256号华夏银行大厦8楼801室上海市浦东南路256号华夏银行大厦8楼801室Tel:86 21 61633088Mail:Web: