实验设计与数据分析-5回归分析.pdf

上传人:asd****56 文档编号:69680779 上传时间:2023-01-07 格式:PDF 页数:27 大小:167.43KB
返回 下载 相关 举报
实验设计与数据分析-5回归分析.pdf_第1页
第1页 / 共27页
实验设计与数据分析-5回归分析.pdf_第2页
第2页 / 共27页
点击查看更多>>
资源描述

《实验设计与数据分析-5回归分析.pdf》由会员分享,可在线阅读,更多相关《实验设计与数据分析-5回归分析.pdf(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、1实验设计与数据分析实验设计与数据分析城环学院硕士课程城环学院硕士课程06授课人:阳春授课人:阳春Experimental Design and Data Analysis2回归分析回归分析Regression Analysis3变量间的相互关系变量间的相互关系 函数关系函数关系:非随机变量之间的关系可以通过一个函数式准确表达出来。相关关系相关关系:随机变量或者随机变量和一般变量之间存在的随机关系,不能够用准确的数学表达式表达出来。4相关变量间的关系相关变量间的关系 因果关系因果关系:某一个变量的变化受一个或多个变量的影响。平行关系平行关系:变量之间互为因果,或者共同受到其它因素的影响。5回归

2、分析回归分析(regression analysis)统计学上用于研究呈因果关系因果关系的变量之间的关系。回归分析的任务是揭示出呈因果关系的相关变量间的联系形式,建立它们之间的回归方程,利用所建立的回归方程,由自变量(原因)来预测、控制因变量(结果)。一因一果:一元回归(线性、非线性);多因一果:多元回归(线性、非线性)6相关分析相关分析(correlation analysis)统计学上用于研究呈平行关系平行关系的变量之间的关系。对两个变量两个变量间的直线关系直线关系进行相关分析称为简单相关分析(直线相关分析);对多个变量多个变量进行相关分析时,研究一个变量与多个变量间的线性相关称为复相关分

3、析复相关分析;研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析偏相关分析。7线性回归线性回归 对于两个相关变量,一个变量用x表示,另一个变量用y表示,通过试验或调查获得两个变量的n对观测值:(x1,y1),(x2,y2),(xn,yn)为了直观地看出x和y间的变化趋势,可将每一对观 测 值 在 平 面直角坐标系描点,作出散点图。8散点图散点图9 散点图直观地直观地、定性地定性地表示了两个变量之间的关系。为了探讨它们之间的规律性,还必须根据观测值将其内在关系定量地定量地表达出来。回归方程就是内在关系的定量表达。10线性回归的数学模型线性回归的数学模型 若绘制的散点图呈直线关系,又由

4、于因变量y的实际观测值总是带有随机误差,因而因变量y的实际观测值yi可用自变量x的实际观测值xi表示为:x 为可以观测的一般变量(也可以是可以观测的随机变量);y 为可以观测的随机变量随机变量;i(残差残差)为相互独立,且都服从N(0,)的随机变量 直线回归的数学模型数学模型。我们可以根据实际观测值对,以及方差做出估计。iiixy+=(i=1,2,n)2211回归直线回归直线 在x、y直角坐标平面上可以作出无数条直线中最接近散点图中全部散点的直线最接近散点图中全部散点的直线用来表示x与y的直线关系,这条直线称为回归直线回归直线。a是的估计值,b是的估计值设回归直线的方程为:bxay+=12回归

5、直线回归直线 a、b应使回归估计值与实际观测值y的偏差平方和最小(最小二乘法),即:=22)()(bxayyyQ有最小值有最小值0)(2=bxayaQ=0)(2xbxaybQ13回归直线的求解回归直线的求解 关于a和b的正规方程组(formal equations):系数a和b:=+yxban=+xyxbxa2xxySSSPxxyyxxnxxnyxxyb=222)()(/)(/)(xbya=14回归直线的求解回归直线的求解 式中的分子是自变量x的离均差与因变 量y的离均差的乘积和,简称乘积和乘积和,记作。分母是自变量x的离均差离均差(偏差偏差)平方和平方和:记作SSX。a叫做样本回归截距样本回

6、归截距,是回归直线与y轴交点的纵坐标,当x=0时,=a;)(yyxxxySP2)(xxy 15回归直线的求解回归直线的求解 b:样本回归系数回归系数(coefficient of regression),表 示 x 改 变一个单位,y平均改变的数量;b 的符号反映了x影响y的性质,b的绝对值大小反映了x 影响 y 的 程度;叫做回归估计值回归估计值,是当x在在其研究 范 围 内取某一个值时,y值平均数的估计值。y x+16 回归方程的性质:回归方程的中心化形式:=2)(yyQ性质性质1最小;0)(=yy性质性质2;),(yx性质性质3回 归 直 线 通 过 点。)(xxbybxxbyy+=+=

7、17线性回归的偏离度估计线性回归的偏离度估计 偏差平方和的大小表示了实测点与回归直线偏离的程度,因而偏差平方和又称为离回归平离回归平方和方和。在直线回归分析中离回归平方和的自由度为n-2。于是可求得离回归均方为:离回归均方是模型中2的估计值。离回归均方的平方根叫离回归标准误离回归标准误,记为,即2)(yy)2/()(2nyyyxS=)2/()(2nyySyx18离回归标准误离回归标准误 离回归标准误Syx的大小表示了回归直线与实测点偏差的程度;是回归估测值与实际观测值y偏差的程度;离回归标准误Syx用来表示回归方程的偏离度。y 19直线回归的显著性检验直线回归的显著性检验 若x和y变量间并不存

8、在直线关系,但由n对观测值(xi,yi)也可以根据上面介绍的方法求得一个回归方程=a+bx。但回归方程所反应的两个变量间的直线关系是不真实的。判断直线回归方程所反应的两个变量间的直线关系的真实性取决于变量x与y间是否存在直线关系。先探讨因变量y的变异,然后再作出统计推断(F检验或者t检验)。y 20直线回归的变异来源直线回归的变异来源21直线回归的变异的分解直线回归的变异的分解上式两端平方,然后对所有的n点求和,则有)()()(yyyyyy+=+=22)()()(yyyyyy)(2)()(22yyyyyyyy+=)(xxbybxay+=+=Q)()(yyxxbyyyy=)()(xxbyyxxb

9、=22是y的总变异程度;总平方和总平方和:SSy是y与x因为存在直线关系而产生的变异;回归平方和回归平方和:SSR是除y与x存在直线关系以外的原因,包括随机误差所引起的y的变异程度,称为离回归离回归平方和平方和(剩余平方和剩余平方和),记为SSr。+=222)()()(yyyyyy2)(yy2)(yy2)-(yyrRySSSSSS+=23 变异的组成:自由度的组成:回归自由度的个数等于变量数:dfR=1;总自由度:dfy=n-1;离回归自由度:dfr=n-1-1=n-2。使用F检验比较回归均方回归均方和离回归均方离回归均方之比。rRySSSSSS+=rRydfdfdf+=24F检验:检验:HO

10、:=0,HA:0;检验统计变量:dfR=1,dfr=n-2t检验:检验:HO:=0,HA:0;检验统计变量:)2/(/=nSSSSdfSSdfSSMSMSFrRrrRRrR2,=ndfSbtbxyxbSSSS=25线性相关线性相关(linear correlation)又称简单相关(simple correlation),用于表示两变量间的相关程度。线性相关分析的基本任务:线性相关分析的基本任务:根据x、y的实际观测值,计算表示两个相关变量x、y间线性相关程度和性质的统计量相关系数r(coefficient of correlation)并进行显著性检验。26相关系数相关系数(correlation coefficient)相关系数是表示两个变量间相关关系的统计指标,反映两个变量线性关系的方向和密切程度的指标。样本相关系数用r表示,总体相关系数用表示。应用条件应用条件:两个变量都是随机变量随机变量且呈正态分布正态分布。2)(2)()(YYXXYYXXr=)2)(2)(2)(2()(nYYnXXnYXXYr=27相关系数相关系数(correlation coefficient)相关系数无单位,-1r0,x和y正相关,变量x和y变化趋势相同;r 0,x和y负相关,变量x和y变化趋势相反;01r2完全相关无线性关系

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁