《回归分析的基本思想及其初步应用三.ppt》由会员分享,可在线阅读,更多相关《回归分析的基本思想及其初步应用三.ppt(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、3.1 3.1 回归分析的回归分析的基本思想及其初基本思想及其初步应用(三)步应用(三)线性回归模型线性回归模型其中,其中,a和和b是模型的未知参数是模型的未知参数.通常通常e为随机变量,称为为随机变量,称为随机误差随机误差.随机误差随机误差e的方差的方差 越小,用越小,用bx+a预报真实预报真实值值y的精度越高的精度越高.思考思考 产生随机误差产生随机误差e的原因是什么?的原因是什么?(1)(1)所用的确定性函数不恰当;所用的确定性函数不恰当;(2)(2)忽略了某些因素的影响;忽略了某些因素的影响;(3)(3)存在观察(测量)误差存在观察(测量)误差.对于样本点对于样本点它们的随机误差为它们
2、的随机误差为其估计量为其估计量为估计量估计量 称为相应于点称为相应于点 的的残差残差思考?思考?如何发现数据中的错误?如何衡量如何发现数据中的错误?如何衡量模型的拟合效果?模型的拟合效果?残差图残差图纵坐标:残差纵坐标:残差横坐标:样本编号,或身高数据,或体重数据等横坐标:样本编号,或身高数据,或体重数据等.结论:结论:(数据正确)如果残差点比较均匀地落在水平的(数据正确)如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适带状区域中,说明选用的模型比较合适.带状区域越窄,模拟拟合精度越高,回归方程的带状区域越窄,模拟拟合精度越高,回归方程的预报越精确预报越精确.思考?思考?如何衡
3、量模型的拟合效果?如何衡量模型的拟合效果?相关指数相关指数越大,模型的拟合越好;越大,模型的拟合越好;越小,模型的拟合越差越小,模型的拟合越差.结论:结论:建立回归模型的基本步骤为:建立回归模型的基本步骤为:(1)确定研究对象,明确变量)确定研究对象,明确变量.(2)画出散点图,观察它们之间的关系)画出散点图,观察它们之间的关系.(3)由经验确定回归方程的类型)由经验确定回归方程的类型.(4)按一定规则估计回归方程中的参数)按一定规则估计回归方程中的参数.(5)得出结果后分析是否有异常)得出结果后分析是否有异常.(根据残差图或相(根据残差图或相关指数估计)关指数估计)例例2 一只红铃虫的产卵数
4、一只红铃虫的产卵数y和温度和温度x有关有关.现现收集了收集了7组观测数据列于表中组观测数据列于表中:试建立产卵数试建立产卵数y与温度与温度x之间的回归方程之间的回归方程.温度温度x/oC21232527293235产卵数产卵数y/个个711212466115325例例2 一只红铃虫的产卵数一只红铃虫的产卵数y和温度和温度x有关有关解:解:作散点图作散点图例例2 一只红铃虫的产卵数一只红铃虫的产卵数y和温度和温度x有关有关解:解:作散点图作散点图例例2 一只红铃虫的产卵数一只红铃虫的产卵数y和温度和温度x有关有关从散点图看出,两个变量没有线性相关关系,可以从散点图看出,两个变量没有线性相关关系,
5、可以认为样本点分布在某一条认为样本点分布在某一条指数函数型曲线指数函数型曲线的周围的周围.设此曲线的方程为设此曲线的方程为其中其中 和和 是待定参数是待定参数.令令 则则非线性回归方程非线性回归方程对数变换对数变换对数变换后的样本数据为:对数变换后的样本数据为:x2121232325252727292932323535z1.946 1.946 2.398 2.398 3.045 3.045 3.178 3.178 4.190 4.190 4.745 4.745 5.784 5.784 对数变换后的样本数据为:对数变换后的样本数据为:x2121232325252727292932323535z1
6、.946 1.946 2.398 2.398 3.045 3.045 3.178 3.178 4.190 4.190 4.745 4.745 5.784 5.784 得到的线性回归方程是得到的线性回归方程是因此产卵数因此产卵数y关于温度关于温度x的非线性回归方程为的非线性回归方程为例例2 一只红铃虫的产卵数一只红铃虫的产卵数y和温度和温度x有关有关解:解:作散点图作散点图例例2 一只红铃虫的产卵数一只红铃虫的产卵数y和温度和温度x有关有关从散点图看出,两个变量没有线性相关关系,可从散点图看出,两个变量没有线性相关关系,可以认为样本点集中在某一条以认为样本点集中在某一条二次曲线二次曲线的附近的附
7、近.设此曲线的方程为设此曲线的方程为其中其中 和和 是待定参数是待定参数.非线性回归方程非线性回归方程令令 则则对数变换对数变换例例2 一只红铃虫的产卵数一只红铃虫的产卵数y和温度和温度x有关有关从散点图看出,两个变量没有线性相关关系,可从散点图看出,两个变量没有线性相关关系,可以认为样本点集中在某一条以认为样本点集中在某一条二次曲线二次曲线的附近的附近.设此曲线的方程为设此曲线的方程为其中其中 和和 是待定参数是待定参数.非线性回归方程非线性回归方程令令 则则平方变换平方变换平方变换后的样本数据为:平方变换后的样本数据为:t4414415295296256257297298418411024
8、102412251225y7 71111212124246666115115325325平方变换后的样本数据为:平方变换后的样本数据为:t4414415295296256257297298418411024102412251225y7 71111212124246666115115325325得到的线性回归方程是得到的线性回归方程是因此产卵数关于温度的非线性回归方程为因此产卵数关于温度的非线性回归方程为残差比较残差比较x2121232325252727292932323535y7 711112121242466661151153253250.557 0.557-0.101-0.101 1.875 1.875-8.950-8.950 9.230 9.230-13.381-13.381 34.675 34.675 47.696 47.696 19.400 19.400-5.832-5.832-41.000-41.000-40.104-40.104-58.265-58.265 77.968 77.968 结论:结论:指数函数型曲线的拟合效果比二次曲线的拟指数函数型曲线的拟合效果比二次曲线的拟合效果好合效果好.相关指数比较相关指数比较结论:结论:指数函数型曲线的拟合效果比二次曲线的拟指数函数型曲线的拟合效果比二次曲线的拟合效果好合效果好.