《回归模型的残差分析.docx》由会员分享,可在线阅读,更多相关《回归模型的残差分析.docx(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、回归模型的残差分析山东 胡大波判断回归模型的拟合效果是回归分析的重要内容,在回归分析中,通常用残差分析来判断回归模型的拟合效果。下面具体分析残差分析的途径及具体例子。一、 残差分析的两种方法 1、差分析的根本方法是由回归方程作出残差图,通过观测残差图,以分析与发现观测数据中可能出现的错误以及所选用的回归模型是否恰当;在残差图中,残差点比拟均匀地落在水平区域中,说明选用的模型比拟适宜,这样的带状区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高。2、可以进一步通过相关指数来衡量回归模型的拟合效果,一般规律是越大,残差平方与就越小,从而回归模型的拟合效果越好。二、 典例分析:例1、某运
2、发动训练次数与运动成绩之间的数据关系如下:次数/x34650成绩/y34851试预测该运发动训练47次以及55次的成绩。解答:1作出该运发动训练次数x与成绩y之间的散点图,如图1所示,由散点图可知,它们之间具有线性相关关系。2列表计算:次数成绩3033341353712251369129537393394284446193621162024464821162304220852550由上表可求得,所以,所以回归直线方程为3计算相关系数将上述数据代入得,查表可知,而,故y与x之间存在显著的相关关系。4残差分析:作残差图如图2,由图可知,残差点比拟均匀地分布在水平带状区域中,说明选用的模型比拟适宜。
3、计算残差的方差得,说明预报的精度较高。5计算相关指数计算相关指数0.9855.说明该运发动的成绩的差异有98.55是由训练次数引起的。6做出预报由上述分析可知,我们可用回归方程作为该运发动成绩的预报值。将x47与x55分别代入该方程可得y49与y57,故预测运发动训练47次与55次的成绩分别为49与57.点评:一般地,建立回归模型的根本步骤为:1确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;2画出确定好的解释变量与预报变量的散点图,观察它们之间的关系如是否存在线性关系等;3由经历确定回归方程的类型如我们观察到数据呈线性关系,那么选用线性回归方程ybxa;4按一定规那么估计回归方程中
4、的参数如最小二乘法;5得出结果后分析残差图是否有异常个别数据对应残差过大,或残差呈现不随机的规律性等等,假设存在异常,那么检查数据是否有误,或模型是否适宜等。例2、某城区为研究城镇居民月家庭人均生活费支出与月人均收入的相关关系,随机抽取10户进展调查,其结果如下:月人均收入x/元月人均生活费y/元3002553903244203355203605704507005207605808006008506301080750试预测人均月收入为1100元与人均月收入为1200元的两个家庭的月人均生活费。解答:作出散点分布图如图,由图可知,月人均生活费与人均收入之间具有线性相关关系。通过计算可知,所以,所以回归直线方程为计算相关系数得,而查表知,故月人均收入与月人均生活费之间具有显著相关关系。作残差图如图,由图可知,残差点比拟均匀地落在水平的带状区域中,说明选用的模型比拟适宜。计算相关指数得0.9863,说明城镇居民的月人均生活费的差异有98.63是由月人均收入引起的。由以上分析可知,我们可以利用回归方程来作为月生活费的预报值。将x1100代入回归方程得y784.59元;将x1200代入回归方程得y850.58元。故预测月人均收入分别为1100元与1200元的两家庭的月人均生活费分别为784.59元与850.58元。第 6 页