《一元线性回归模型及其应用教案--高二下学期数学人教A版(2019)选择性必修第三册.docx》由会员分享,可在线阅读,更多相关《一元线性回归模型及其应用教案--高二下学期数学人教A版(2019)选择性必修第三册.docx(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章 成对数据的统计分析8.2 一元线性回归模型及其应用教学设计一、教学目标1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义.2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.3.针对实际问题,会用一元线性回归模型进行预测.二、教学重难点1、教学重点一元线性回归模型参数的统计意义及求解方法、求一元线性回归模型.2、教学难点一元线性回归模型参数的最小二乘估计方法.三、教学过程1、新课导入这节课我们来研究当两个变量线性相关时,如何利用成对样本数据建立统计模型,并利用模型进行预测的问题.2、探索新知一、一元线性回归模型称为Y关于x的一元线性
2、回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与之间的随机误差.二、一元线性回归模型随机误差的产生原因在研究儿子身高与父亲身高的关系时,产生随机误差e的原因有:(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等;(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差;(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似也是产生随机误差e的原因.三、探究“最贴近”直线的方法从成对样本数据出发,用数学的方法刻画
3、“从整体上看,各散点与直线最接近”.通常利用点到直线的“距离”来刻画散点与该直线的接近程度,然后用所有“距离”之和刻画所有样本观测数据与该直线的接近程度. 设满足一元线性回归模型的两个变量的n对样本数据为,由,得. 显然越小,表示点与点的“距离”越小,即样本数据点离直线的竖直距离越小. 特别地,当时,表示点在这条直线上. 因此,可以用这n个距离之和来刻画各样本观测数据与直线的“整体接近程度”.在实际应用中,因为绝对值使得计算不方便,所以通常用各散点到直线的竖直距离的平方之和来刻画“整体接近程度”.在式中,是已知的成对样本数据,所以Q由a和b所决定,即它是a和b的函数. 因为Q还可以表示为,即它
4、是随机误差的平方和,这个和当然越小越好,所以我们取使式达到最小的a和b的值,作为截距和斜率的估计值.四、最小二乘法求参数a,b下面利用成对样本数据求使Q取最小值的a,b.记,因为,注意到,所以.上式右边各项均为非负数,且前n项与a无关。所以,要使Q取到最小值,后一项的值应为0,即.此时.上式是关于b的二次函数,因此要使Q取得最小值,当且仅当b的取值为.综上,当a,b的取值为时,Q达到最小.五、经验回归方程将称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线. 这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计.六、误差分析对于响应变量Y,通
5、过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差,残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析. 借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.七、用比较模型的拟合效果也可以用来比较两个模型的拟合效果,的计算公式为.在表达式中,与经验回归方程无关,残差平方和与经验回归方程有关,因此越大,意味着残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差
6、.在使用经验回归方程进行预测时,需要注意下列问题:1.经验回归方程只适用于我们所研究的样本的总体.2.所建立的经验回归方程一般都有时间性.3.在样本数据中的响应变量的取值范围内,经验回归方程的预报效果好,超出这个范围越远,预报的效果越差.4.不能期望经验回归方程得到的预报值就是响应变量的精确值. 事实上,它是响应变量的可能取值的平均值.3.课堂练习1.某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如下表:记忆力x681012判断力y2356根据上表提供的数据,用最小二乘法求出y关于x的经验回归方程中的值为0.7,则记忆力为14的学生的判断力约为( )A.7B.7.5C.8D.8
7、.5答案:B解析:因为,代入中,得,所以经验回归方程为,把代入,得.故选B.2.某种产品的广告费支出x(万元)与销售额y(万元)之间有如表所示的线性相关关系,y与x的经验回归方程为,当广告支出5万元时,残差为( )x24568y3040605070A.10B.20C.30D.40答案:A解析:因为y与x的经验回归方程为,所以当时,由表格知当广告支出5万元时,销售额为60万元,所以残差为.故选A.3.某工厂为研究某种产品的产量x(吨)与所需某种原材料的质量y(吨)的相关性,在生产过程中收集4组对应数据,如下表所示.(残差=观测值-预测值)x3456y2.534m根据表中数据,得出y关于x的经验回
8、归方程为.据此计算出在样本处的残差为-0.15,则表中m的值为_.答案:4.5解析:由在样本处的残差为,可得,则,解得.由题表可知,产量x的平均数为,由经验回归方程为过点,可得,则,解得.4、小结作业小结:本节课学习了一元线性回归模型参数的统计意义及求解方法、求一元线性回归模型以及用一元线性回归模型进行预测.作业:完成本节课课后习题.四、板书设计8.2 一元线性回归模型及其应用1.一元线性回归模型:将称为Y关于x的一元线性回归模型. 其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与之间的随机误差.2.经验回归方程:将称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线. 这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计.3.误差分析:对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差,残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.4.用比较模型的拟合效果:用来比较两个模型的拟合效果,的计算公式为. 越大,意味着残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差.学科网(北京)股份有限公司