《人教版-高中数学-选修1-2—1.1回归分析的基本思想及其初步应用(第一课时)ppt课件.ppt》由会员分享,可在线阅读,更多相关《人教版-高中数学-选修1-2—1.1回归分析的基本思想及其初步应用(第一课时)ppt课件.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、复习引入复习引入必修必修3(第二章第二章 统计统计)知识结构知识结构 收集数据收集数据 (随机抽样随机抽样)整理、分析数据整理、分析数据估计、推断估计、推断简简单单随随机机抽抽样样分分层层抽抽样样系系统统抽抽样样用样本估计总体用样本估计总体变量间的相关关系变量间的相关关系用样本的用样本的频率分布频率分布估计总体估计总体分布分布用样本数用样本数字特征估字特征估计总体数计总体数字特征字特征线线性性回回归归分分析析复习引入复习引入统计的基本思想统计的基本思想实际实际样本样本模模 拟拟抽抽 样样分分 析析)(xfy )(xfy )(xfy 新课讲授新课讲授一、现实生活中两个变量间的关系一、现实生活中两
2、个变量间的关系:1.两个变量的关系两个变量的关系不相关不相关相关相关关系关系函数关系函数关系线性相关线性相关非线性相关非线性相关相关关系:相关关系:对于两个变量,当自变量取值一定对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量时,因变量的取值带有一定随机性的两个变量之间的关系之间的关系.新课讲授新课讲授一、现实生活中两个变量间的关系一、现实生活中两个变量间的关系:2.相关关系与函数关系相关关系与函数关系函数关系中的两个变量间是一种确定性关系函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系相关关系是一种非确定性关系.函数关系是一种理想的关系模型函数关系是一种
3、理想的关系模型.相关关系在现实生活中大量存在,是更一般相关关系在现实生活中大量存在,是更一般的情况的情况.新课讲授新课讲授一、现实生活中两个变量间的关系一、现实生活中两个变量间的关系:(1)收集数据;收集数据; (2)作散点图;作散点图;(3)求回归直线方程;求回归直线方程; (4)利用方程进行预报利用方程进行预报.3. 回归分析是对具有相关关系的两个变量回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤进行统计分析的一种常用方法,其步骤:新课讲授新课讲授二、刻划线性相关的两个变量间的关系的方法:二、刻划线性相关的两个变量间的关系的方法:1.所求直线方程所求直线方程 叫做叫做
4、回归直线方程回归直线方程;其中其中 axby xbyaxnxyxnyxxxyyxxbniiniiiniiniii1221121)()(新课讲授新课讲授二、刻划线性相关的两个变量间的关系的方法:二、刻划线性相关的两个变量间的关系的方法:3.对对两个两个变量进行的线性分析叫做变量进行的线性分析叫做线性回归线性回归分析分析.2.相应的直线叫做相应的直线叫做回归直线回归直线.例题讲解例题讲解案例案例1 女大学生的身高与体重女大学生的身高与体重例例1.从某大学中随机选取从某大学中随机选取8名女大学生,其身高名女大学生,其身高和体重数据如表所示和体重数据如表所示.求根据女大学生的身高预报体重的回归方程,求
5、根据女大学生的身高预报体重的回归方程,并预报一名身高为并预报一名身高为172 cm的女大学生的体重的女大学生的体重.编编 号号12345678身高身高/cm165165157170175165155170体重体重/kg4857505464614359例题讲解例题讲解案例案例1 女大学生的身高与体重女大学生的身高与体重4018040体重体重/kg5060155150165160170 175456555身高身高/cm解:解:(1) 选取身高为自变选取身高为自变量量x,体重为因变量,体重为因变量y,作散点图作散点图:编编 号号12345678身高身高/cm165165157170175165155
6、170体重体重/kg4857505464614359(2)由散点图知道身高和体重有比较好的线性由散点图知道身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它相关关系,因此可以用线性回归方程刻画它们之间的关系们之间的关系.例题讲解例题讲解案例案例1 女大学生的身高与体重女大学生的身高与体重18040体重体重/kg5060155150165160170 175456555身高身高/cm(3)从散点图还看到,从散点图还看到,样本点散布在某一样本点散布在某一条直线的附近,而条直线的附近,而不是在一条直线上,不是在一条直线上,所以不能用一次函所以不能用一次函数数y=bx+a描述它们描述它们关
7、系关系.我们可以用下面的我们可以用下面的线性回归模型线性回归模型来表示:来表示:y=bx+a+e,其中其中a和和b为模型的未知参数,为模型的未知参数,e称为随机误差称为随机误差.产生随机误差项产生随机误差项e的原因是什么?的原因是什么?例题讲解例题讲解案例案例1 女大学生的身高与体重女大学生的身高与体重产生随机误差项产生随机误差项e的原因是什么?的原因是什么?新课讲授新课讲授产生随机误差项产生随机误差项e的原因是什么?的原因是什么?随机误差随机误差e的来源的来源(可以推广到一般):可以推广到一般):(1)其它因素的影响:影响体重其它因素的影响:影响体重y 的因素不只的因素不只是身高是身高x,可
8、能还包括遗传基因、饮食习惯、,可能还包括遗传基因、饮食习惯、生长环境等因素;生长环境等因素;(2)用线性回归模型近似真实模型所引起的误用线性回归模型近似真实模型所引起的误差;差;(3)身高身高y的观测误差的观测误差.新课讲授新课讲授函数模型与回归模型之间的差别函数模型与回归模型之间的差别中国中国GDP散点图散点图20000400006000080000100000120000199219931994199519961997199819992000200120022003GDP函数模型:函数模型:abxy 回归模型:回归模型:eabxy 可以提供可以提供选择模型的准则选择模型的准则新课讲授新课讲
9、授函数模型与回归模型之间的差别函数模型与回归模型之间的差别函数模型:函数模型:abxy 回归模型:回归模型:eabxy 线性回归模型线性回归模型y=bx+a+e增加了随机误差项增加了随机误差项e,因变量因变量y的值由自变量的值由自变量x和随机误差项和随机误差项e共同共同确定,即确定,即自变量自变量x只能解析部分只能解析部分y的变化的变化.在统计中,我们也把自变量在统计中,我们也把自变量x称为解析变量,称为解析变量,因变量因变量y称为预报变量称为预报变量.新课讲授新课讲授解释变量解释变量x(身高)(身高)随机误差随机误差e预报变量预报变量y(体重)(体重)新课讲授新课讲授例题讲解例题讲解编编 号
10、号12345678身高身高/cm165165157170175165155170体重体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程,并预求根据女大学生的身高预报体重的回归方程,并预报一名身高为报一名身高为172 cm的女大学生的体重的女大学生的体重.849. 01221 niiniiixnxyxnyxb例题讲解例题讲解编编 号号12345678身高身高/cm165165157170175165155170体重体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程,并预求根据女大学生的身高预报体重的回归方程,并预报一名身高为报一名身高为
11、172 cm的女大学生的体重的女大学生的体重.根据最小二乘法估计根据最小二乘法估计 和和 就是未知参数就是未知参数a和和b的最好估计,的最好估计,于是有于是有 a b所以回归方程是所以回归方程是所以,对于身高为所以,对于身高为172cm的女大学生,由回归方程可以预的女大学生,由回归方程可以预报其体重报其体重712.85 xbya712.85849. 0 xy)kg(316.60712.8572849. 0 y例题讲解例题讲解编编 号号12345678身高身高/cm165165157170175165155170体重体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程
12、,并预求根据女大学生的身高预报体重的回归方程,并预报一名身高为报一名身高为172 cm的女大学生的体重的女大学生的体重.根据最小二乘法估计根据最小二乘法估计 和和 就是未知参数就是未知参数a和和b的最好估计,的最好估计,于是有于是有所以回归方程是所以回归方程是所以,对于身高为所以,对于身高为172cm的女大学生,由回归方程可以预的女大学生,由回归方程可以预报其体重报其体重849. 01221 niiniiixnxyxnyxb712.85 xbya712.85849. 0 xy)kg(316.60712.85172849. 0y a b例题讲解例题讲解案例案例1 女大学生的身高与体重女大学生的身
13、高与体重身高为身高为172cm的女大学生的体重一定是的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?吗?如果不是,你能解析一下原因吗?编编 号号12345678身高身高/cm165165157170175165155170体重体重/kg4857505464614359例题讲解例题讲解案例案例1 女大学生的身高与体重女大学生的身高与体重身高为身高为172cm的女大学生的体重一定是的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?吗?如果不是,你能解析一下原因吗?答:身高为答:身高为172cm的女大学生的体重不一定是的女大学生的体重不一定是60.316
14、kg,但一般可以认为她的体重在,但一般可以认为她的体重在60.316kg左右左右.编编 号号12345678身高身高/cm165165157170175165155170体重体重/kg4857505464614359如何描述两个变量之间线性相关关系的强弱?如何描述两个变量之间线性相关关系的强弱? 在在数学数学3中,我们学习了用相关系数中,我们学习了用相关系数r来衡量两个变量之间线性相关关系的方法来衡量两个变量之间线性相关关系的方法.相关系数相关系数 niiniiniiiyyxxyyxxr12121)()()(当当r0.75,1,表明两个变量正相关很强;,表明两个变量正相关很强;当当r1,0.7
15、5,表明两个变量负相关很强;,表明两个变量负相关很强;当当r0.25, 0.25,表明两个变量相关性较弱,表明两个变量相关性较弱.新课讲授新课讲授相关关系的测度相关关系的测度(相关系数取值及其意义)(相关系数取值及其意义)1.0+1.00-0.5+0.5完全负相关完全负相关无线性相关无线性相关完全正相关完全正相关负负相关程度增加相关程度增加r正相关程度增加正相关程度增加新课讲授新课讲授用身高预报体重时,需要注意下列问题:用身高预报体重时,需要注意下列问题:这些问题也使用于其他问题这些问题也使用于其他问题.(1)回归方程只适用于我们所研究的样本的总体;回归方程只适用于我们所研究的样本的总体;(2
16、)我们所建立的回归方程一般都有时间性;我们所建立的回归方程一般都有时间性;(3)样本采集的范围会影响回归方程的适用范围;样本采集的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报不能期望回归方程得到的预报值就是预报变量的精确值变量的精确值. 事实上,它是预报变量的可能事实上,它是预报变量的可能取值的平均值取值的平均值.课堂小结课堂小结涉及到统计的一些思想:涉及到统计的一些思想:模型适用的总体;模型适用的总体;模型的时间性;模型的时间性;样本的取值范围对模型的影响;样本的取值范围对模型的影响;模型预报结果的正确理解模型预报结果的正确理解.课堂小结课堂小结一般地,建立回归模
17、型的基本步骤为:一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点画出确定好的解释变量和预报变量的散点图,观察它们之间的关系图,观察它们之间的关系 (如是否存在线性(如是否存在线性关系等)关系等).(3)由经验确定回归方程的类型(如我们观察由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程到数据呈线性关系,则选用线性回归方程y=bx+a).课堂小结课堂小结(4)按一定规则估计回归方程中的参数(如最按一定规则估计回归方程中的参数(如最小二乘法)小二乘法).课后作业课后作业学案学案与与习案习案.