《回归分析的基本思想及其初步应用(选修1-2)第一课时.ppt》由会员分享,可在线阅读,更多相关《回归分析的基本思想及其初步应用(选修1-2)第一课时.ppt(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1.1 1.1 回归分析的基本思想及其初步应用 高中数学选修高中数学选修1-2 1-2 第一章第一章 统计案例统计案例 比数学3中“回归”增加的内容数学数学统计统计1.1.画散点图画散点图画散点图画散点图2.2.了解最小二乘法了解最小二乘法了解最小二乘法了解最小二乘法的思想的思想的思想的思想3.3.求回归直线方程求回归直线方程求回归直线方程求回归直线方程y ybxbxa a4.4.用回归直线方程用回归直线方程用回归直线方程用回归直线方程解决应用问题解决应用问题解决应用问题解决应用问题选修选修-统计案例统计案例5.5.引入线性回归模型引入线性回归模型引入线性回归模型引入线性回归模型y ybxbx
2、a ae e6.6.了解模型中随机误差项了解模型中随机误差项了解模型中随机误差项了解模型中随机误差项e e产产产产生的原因生的原因生的原因生的原因7.7.了解相关指数了解相关指数了解相关指数了解相关指数 R R2 2 和模型拟和模型拟和模型拟和模型拟合的效果之间的关系合的效果之间的关系合的效果之间的关系合的效果之间的关系8.8.了解残差图的作用了解残差图的作用了解残差图的作用了解残差图的作用9.9.利用线性回归模型解决一类利用线性回归模型解决一类利用线性回归模型解决一类利用线性回归模型解决一类非线性回归问题非线性回归问题非线性回归问题非线性回归问题10.10.正确理解分析方法与结果正确理解分析
3、方法与结果正确理解分析方法与结果正确理解分析方法与结果问题问题1:正方形的面积正方形的面积y与正方形的边长与正方形的边长x之间的之间的函数关系函数关系是是y=x2确定性关系确定性关系问题问题2:某水田水稻产量某水田水稻产量y与施肥量与施肥量x之间是之间是 否有一个确定性的关系?否有一个确定性的关系?例如:在例如:在7块并排、形状大小相同的试验田上进行施肥块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一组数:量对水稻产量影响的试验,得到如下所示的一组数:施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 4
4、45 450 455一、线性回归分析一、线性回归分析当施肥量当施肥量x一定时,水稻产量一定时,水稻产量y的值带有一定的随机性的值带有一定的随机性复习回顾 自变量取值一定时,因变量的取值带有一定自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做随机性的两个变量之间的关系叫做相关关系相关关系。定义:定义:1):相关关系是一种不确定性关系;):相关关系是一种不确定性关系;注注对具有相关关系的两个变量进行统计对具有相关关系的两个变量进行统计分析的方法叫分析的方法叫回归分析回归分析。2):):二、二、现实生活中存在着大量的相关关系。现实生活中存在着大量的相关关系。如:人的身高与年龄;如
5、:人的身高与年龄;产品的成本与生产数量;产品的成本与生产数量;商品的销售额与广告费;商品的销售额与广告费;家庭的支出与收入。家庭的支出与收入。等等等等播放天数123 34 45 56 67 78 891010点击观看点击观看累积人次累积人次51134213235235262262294294330330378378 457 533533例例1 1:在一个文娱网络中,点击观看某个节在一个文娱网络中,点击观看某个节目的累积人次有如下表数据目的累积人次有如下表数据:典型范例:典型范例:三、三、散点图:散点图:(1)定义:)定义:表示具有相关关系的两个变量的表示具有相关关系的两个变量的 一组数据的图形
6、一组数据的图形。(2)特点:各个点大致分布在一条直线的附近)特点:各个点大致分布在一条直线的附近 四、四、一般地,设一般地,设x与与y是具有相关关系的两是具有相关关系的两个变量,且相应于个变量,且相应于n个观测值的个观测值的n个点大致个点大致分布在一条直线的附近,我们来求在整体分布在一条直线的附近,我们来求在整体上与这上与这n个点个点最接近最接近的的一条直线一条直线。(1)设所求的直线的方程是)设所求的直线的方程是:其中其中 是待确定的参数,于是,当变是待确定的参数,于是,当变量量x 取一组数值取一组数值 时,相应地时,相应地(2 2)各个偏差:)各个偏差:的符号有正有负,相加会相互抵消。的符
7、号有正有负,相加会相互抵消。的和的和不能不能代表代表n个点与相应直线在个点与相应直线在整体上的接近程度整体上的接近程度。为了避免相加时为了避免相加时 正负相互抵消,引入以下概念:正负相互抵消,引入以下概念:用用Q来表示来表示n个点与相应直线个点与相应直线在整体上的在整体上的接近程度接近程度。即:即:(3)各偏差的平方和:)各偏差的平方和:(4)求出使)求出使Q为最小值时的为最小值时的a、b的值的值:其中其中将所得到的方程将所得到的方程 叫做叫做回归直线方回归直线方程程,相应的直线叫做,相应的直线叫做回归直线回归直线。对两个变量所对两个变量所进行的上述统计分析叫做进行的上述统计分析叫做线性回归分
8、析线性回归分析。新课内容新课内容编号编号编号编号1 12 23 34 45 56 67 78 8身高身高身高身高/cmcm165165165165157157170170175175165165155155170170体重体重体重体重/kgkg48485757505054546464616143435959解:解:例例例例1 1(线性回归线性回归线性回归线性回归问题问题问题问题)从从从从 某某某某大学生中随机选取大学生中随机选取8名女大学生,其身高和体重数名女大学生,其身高和体重数据如下表所示。据如下表所示。求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为求根据一名女大学生的身
9、高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。的女大学生的体重。画画画画散点图;散点图;散点图;散点图;y=bx+a+y=bx+a+e e其中其中a,b为回归模型的未为回归模型的未知参数,知参数,e为为随机误差随机误差引入线性回归模型引入线性回归模型引入线性回归模型引入线性回归模型:探究思考:探究思考:探究思考:探究思考:身高身高身高身高172 cm 172 cm 172 cm 172 cm 的女大学生的体重的女大学生的体重的女大学生的体重的女大学生的体重一定是一定是一定是一定是60.316 kg60.316 kg60.316 kg60.316 kg吗?吗?吗?吗?回归
10、方程:回归方程:回归方程:回归方程:=0.849x-85.712=0.849x-85.712=0.849x-85.712=0.849x-85.712 为什么为什么为什么为什么身高身高身高身高172 cm 172 cm 172 cm 172 cm 的女大学生的体重不一定是的女大学生的体重不一定是的女大学生的体重不一定是的女大学生的体重不一定是60.316 kg60.316 kg60.316 kg60.316 kg呢?呢?呢?呢?所以,所以,在回归模型中在回归模型中,预报变量预报变量(因变量)(因变量)是是解释变量解释变量(自变量)与(自变量)与随机误差随机误差共同作用的共同作用的结果。结果。(1
11、)其它因素的影响其它因素的影响:影响身高:影响身高 y 的因素不只是体重的因素不只是体重 x,可能还包括遗传基因、饮食习惯、生长环境等因素可能还包括遗传基因、饮食习惯、生长环境等因素(2)用线性回归模型近似真实模型所引起的误差用线性回归模型近似真实模型所引起的误差。(3)身高身高 y 的观测误差的观测误差。相关系数相关系数为了描述两变量之间线性相关关系的强弱,引入为了描述两变量之间线性相关关系的强弱,引入为了描述两变量之间线性相关关系的强弱,引入为了描述两变量之间线性相关关系的强弱,引入(1).r0-(1).r0-两变量正相关;两变量正相关;r0-r0.75r0.75时,认为两变量有很强的线性
12、相关关系。时,认为两变量有很强的线性相关关系。线性回归分析一般步骤1 1、计算、计算2 2、求出回归系数、求出回归系数3 3、求出回归方程、求出回归方程4 4、计算相关系数,判断两变量相关性的强弱、计算相关系数,判断两变量相关性的强弱课后作业某班某班某班某班5 5名学生的数学成绩(名学生的数学成绩(名学生的数学成绩(名学生的数学成绩(x x)和化学成绩()和化学成绩()和化学成绩()和化学成绩(y y)如下表)如下表)如下表)如下表所所所所示,对示,对示,对示,对x x与与与与y y进行分析进行分析进行分析进行分析:(1)(1)求出回归方程求出回归方程求出回归方程求出回归方程(2)(2)已知某
13、学生数学成绩为已知某学生数学成绩为已知某学生数学成绩为已知某学生数学成绩为7575分,预报他的化学成绩。分,预报他的化学成绩。分,预报他的化学成绩。分,预报他的化学成绩。(3)(3)求出相关系数,判断数学成绩与化学成绩是否有很强求出相关系数,判断数学成绩与化学成绩是否有很强求出相关系数,判断数学成绩与化学成绩是否有很强求出相关系数,判断数学成绩与化学成绩是否有很强的相关关系。的相关关系。的相关关系。的相关关系。A AB BC CD DE E数学成数学成绩绩 (x)(x)88887676737366666363化学成化学成绩绩 (y)(y)78786565717164646161学生学科Class is overClass is over!