《线性回归方程讲稿.ppt》由会员分享,可在线阅读,更多相关《线性回归方程讲稿.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于线性回归方程第一页,讲稿共三十页哦 有些教师常说:有些教师常说:“如果你的数学成绩好,那么如果你的数学成绩好,那么你的物理学习就不会有什么大问题你的物理学习就不会有什么大问题”按照这种说法按照这种说法,似乎学生的物理成绩与数学成绩之间也存在着某,似乎学生的物理成绩与数学成绩之间也存在着某种关系。你如何认识它们之间存在的关系?种关系。你如何认识它们之间存在的关系?物理成绩物理成绩 数学成绩数学成绩 学习兴趣学习兴趣 学习时间学习时间 其他因素其他因素结论:变量之间除了函数关系外,还有结论:变量之间除了函数关系外,还有 。问题引入:问题引入:第二页,讲稿共三十页哦 函数关系函数关系-变量之间是
2、一种确定性变量之间是一种确定性的关系的关系.如如:圆的面积圆的面积S和半径和半径r之间的关之间的关系系.相关关系相关关系变量之间有一定的联系变量之间有一定的联系,但不能完全的用函数来表达但不能完全的用函数来表达.一般来说一般来说,身身高越高高越高,体重越重体重越重,但不能用一个函数来但不能用一个函数来严格地表示身高与体重之间的关系严格地表示身高与体重之间的关系.(非确非确定性关系定性关系)变量之间的关系变量之间的关系第三页,讲稿共三十页哦函数关系是一种确定的关系;函数关系是一种确定的关系;相关关系与函数关系的异同点:相关关系与函数关系的异同点:均是指两个变量的关系均是指两个变量的关系问题:问题
3、:举一两个现实生活中的问题,问题所涉及的变量之间举一两个现实生活中的问题,问题所涉及的变量之间存在一定的相关关系。存在一定的相关关系。(1 1)父母的身高与子女身高之间的关系)父母的身高与子女身高之间的关系(2 2)商品销售收入与广告支出经费之间的关系()商品销售收入与广告支出经费之间的关系(3 3)粮食产量与施肥量之间的关系)粮食产量与施肥量之间的关系 例例:相关关系是一种非确定关系相关关系是一种非确定关系.相同点:相同点:不同点:不同点:第四页,讲稿共三十页哦问题:问题:某小卖部为了了解热茶销售量与气温某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某之间的关系,随机统计并制作
4、了某6天天卖出热茶的杯数与当天气温的对照表:卖出热茶的杯数与当天气温的对照表:气温气温/0C261813104 -1杯数杯数202434385064如果某天的气温是如果某天的气温是-50C,你能根据这些,你能根据这些数据预测这天小卖部卖出热茶的杯数吗数据预测这天小卖部卖出热茶的杯数吗?第五页,讲稿共三十页哦 为了了解热茶销量与为了了解热茶销量与气温的大致关系气温的大致关系,我们我们以横坐标以横坐标x x表示气温,表示气温,纵坐标纵坐标y y表示热茶销量,表示热茶销量,建立直角坐标系建立直角坐标系.将表将表中数据构成的中数据构成的6 6个数对个数对表示的点在坐标系内表示的点在坐标系内标出,得到下
5、图。今标出,得到下图。今后我们称这样的图为后我们称这样的图为散点图散点图(scatterplot).(scatterplot).第六页,讲稿共三十页哦 选择怎样的直线近似地表示热茶销量与气选择怎样的直线近似地表示热茶销量与气温之间的关系温之间的关系?我们有多种思考方案我们有多种思考方案:(1)选择能反映直线变化的两个点选择能反映直线变化的两个点,例如取例如取(4,50),(18,24)(2)取一条直线)取一条直线,使得位于该直线一侧和使得位于该直线一侧和另一侧的点的个数基本相同;另一侧的点的个数基本相同;(3)多取几组点)多取几组点,确定几条直线方程确定几条直线方程,再分再分别算出各条直线斜率
6、、截距的平均值别算出各条直线斜率、截距的平均值,作为作为所求直线的斜率、截距;所求直线的斜率、截距;怎样的直线最好呢怎样的直线最好呢?这两点的直线;这两点的直线;第七页,讲稿共三十页哦建构数学建构数学 ybxa ybxa1.最小二乘法:最小二乘法:用方程为用方程为的点,应使得该直线与散点图中的点最接近的点,应使得该直线与散点图中的点最接近那么,怎样衡量直线那么,怎样衡量直线 与图中六与图中六个点的接近程度呢?个点的接近程度呢?的直线拟合散点图中的直线拟合散点图中 yx26,18,13,10,4,babababababa 我们将表中给出的自变量我们将表中给出的自变量代入直线方程代入直线方程,得到
7、相应的六个值:得到相应的六个值:的的六个六个值值 它们与表中相应的实际值应该越接近越好它们与表中相应的实际值应该越接近越好.第八页,讲稿共三十页哦22222222(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172Q a bb ab ab ab ab ab abaabba 所以所以,我们用类似于估计平均数时的我们用类似于估计平均数时的思想思想,考虑离差的平方和考虑离差的平方和 第九页,讲稿共三十页哦 ybxa,a b(,)Q a b与图中六个点的接近与图中六个点的接近程度程度,所以所以,设法设法取取 达到最小值达到最小值.的值的值,使
8、使这种方法叫做这种方法叫做最小平方法最小平方法(又称又称最小最小二乘法二乘法).(,)Q a b ybxa是直线是直线在垂直方向在垂直方向(纵轴方向纵轴方向)上的距离的平上的距离的平方和方和,可以用来衡量可以用来衡量直线直线与各散点与各散点第十页,讲稿共三十页哦222222(,)128661403820460101721286(1403820)64601017214038201286(.)12867019101286().1286701910()1286Q a bbaabbababaaabbababf b把a看作常数,那么Q是关于b的二次函数记为f(b)f(b)当时,取最小值第十一页,讲稿共三
9、十页哦2222()6(140460)12863820101721404606(.)6702306().670230()6f aababbbaababaf a把b看作常数,那么Q是关于a的二次函数记为f(a)当时,取最小值第十二页,讲稿共三十页哦070191012867023061.6477,57.55681.647757.5568566566abQbabayxxyC 当时,(a,b)取最小值解得所求直线方程为当时,故当气温为时,热茶销量约为杯。第十三页,讲稿共三十页哦线性相关关系线性相关关系:像这样能用直线方程像这样能用直线方程 ybxa近似表示的相关关系叫做近似表示的相关关系叫做线性相关关系
10、线性相关关系.如果散点图中的点分布从整体上如果散点图中的点分布从整体上看大致在一条直线附近我们就称这两看大致在一条直线附近我们就称这两个变量之间具有个变量之间具有线性相关线性相关关系关系 第十四页,讲稿共三十页哦x1x2x3xnxy1y2y3yny线性回归方程:线性回归方程:一般地一般地,设有设有n个观察数据如下:个观察数据如下:2221122()().()nnQybxaybxaybxa ybxa当当a,b使使取得最小值时取得最小值时,就称就称这这n对数据的对数据的线性回归方程线性回归方程,该方程所表该方程所表示的直线称为示的直线称为回归直线回归直线.为拟合为拟合第十五页,讲稿共三十页哦222
11、1122222211111()().()222nnnnnnniiiiiiiiiiiQybxaybxaybxaybx yaybxabxna第十六页,讲稿共三十页哦 类似地,我们可以推得,求回归方程类似地,我们可以推得,求回归方程 中系数中系数a,b的一般公式的一般公式:ybxa1122211()(),()nni iiiiinniiiixy nxyxx yybxnxxxa y bx 以上公式的推导较复杂,故不作推导,但它的以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫小,这一方法叫最小二乘法最小二乘法。
12、第十七页,讲稿共三十页哦求解线性回归问题的步骤求解线性回归问题的步骤:1.列表列表(),画散点图,画散点图.2.计算计算:3.代入公式求代入公式求a,b4.列出直线方程列出直线方程iiiiyxyx,211,nniiiiix yxx y第十八页,讲稿共三十页哦例题例题1:下表为某地近几年机动车辆数与交通事:下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系,求出线性回故数之间是否具有线性相关关系,求出线性回归方程归方程;如果不具有线性相关关系如果不具有线性相关关系,说明理由说明理由第十九页,讲稿共三十页哦
13、解:在直角坐标系中画出数据的散点图,直解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相观判断散点在一条直线附近,故具有线性相关关系关关系第二十页,讲稿共三十页哦88118821181822211031,128.875,71.6,8.95,137835,9611.79611.78 128.875 8.951378358 128.8758.95128.875iiiiiiiiiiiiiixxyyxx yx ynxybxnxaybx 将它们代入*式:0.07740.0774-1.0241所以,所求线性回归方程为 y0.0774x-1.0241第二十一页,讲稿共三十页哦第二十
14、二页,讲稿共三十页哦P75 练习练习2第二十三页,讲稿共三十页哦回归分析的基本步骤回归分析的基本步骤:画散点图画散点图求回归方程求回归方程预报、决策预报、决策第二十四页,讲稿共三十页哦问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?如何对一组数据之间的线性相关程度作出定量分析?第二十五页,讲稿共三十页哦相关系数相关系数 1.1.计算公式计算公式 2 2相关系数的性质相关系数的性质(1)|r|1(1)|r|1(2)|r|(2)|r|越接近于越接近
15、于1 1,相关程度越强;,相关程度越强;|r|r|越接越接近于近于0 0,相关程度越弱,相关程度越弱n ni ii ii i=1 1n nn n2 22 2i ii ii i=1 1i i=1 1(x x-x x)(y y-y y)r r=(x x-x x)(y y-y y)2 2_ _n n1 1i i2 2i i2 2_ _n n1 1i i2 2i in n1 1i i_ _ _i ii iy yn ny yx xn nx xy yx xn ny yx x超级链接超级链接第二十六页,讲稿共三十页哦散点图只是形象地描述点的分布情况,要想把握其特征,散点图只是形象地描述点的分布情况,要想把握
16、其特征,必须进行定量的研究必须进行定量的研究第二十七页,讲稿共三十页哦相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况小结:小结:1.1.变量之间的两种关系:变量之间的两种关系:确定性关系与确定性关系与相关关系相关关系第二十八页,讲稿共三十页哦2。对于线性相关的两个变量用什么方法来刻画。对于线性相关的两个变量用什么方法来刻画之间的关系呢?之间的关系呢?最小二乘法最小二乘法最小二乘法估计线性回归方程:最小二乘法估计线性回归方程:ybxa1122211()(),()nniiiiiinniiiix ynxyxxyybxnxxxaybx第二十九页,讲稿共三十页哦感谢大家观看感谢大家观看第三十页,讲稿共三十页哦