《2.4.1线性回归方程(1).pdf》由会员分享,可在线阅读,更多相关《2.4.1线性回归方程(1).pdf(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.4 第 8 课时 线性回归方程(1)教学目标(1)通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;(2)在两个变量具有线性相关关系时,会在散点较长中作出线性直线,会用线性回 归方程进行预测;(3)知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解(线性)相关系数的定义 教学重点 散点图的画法,回归直线方程的求解方法 教学难点 回归直线方程的求解方法 教学过程 一、问题情境 1情境:客观事物是相互联系的 过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系 比如说:某某同学的数学成绩与物理成绩,
2、彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说 事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度 所以说,函数关系存在着一种确定性关系 但还存在着另一种非确定性关系相关关系 2问题:某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6 天卖出热茶的杯数与当天气温的对照表:气温/0C 26 18 13 10 4 1 杯数 20 24 34 38 50 64 如果某天的气温是50C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?二、学生活动 为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系
3、,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.选择怎样的直线近似地表示热茶销量与气温之间的关系?我们有多种思考方案:(1)选 择 能 反 映 直 线 变 化 的 两 个 点,例 如 取(4,50),(18,24)这两点的直线;(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;怎样的直线最好呢?三、建构数学 1最小平方
4、法:用方程为 ybxa的直线拟合散点图中的点,应使得该直线与散点图中的点最接近。那么,怎样衡量直线 ybxa与图中六个点的接近程度呢?我们将表中给出的自变量x的六个值带入直线方程,得到相应的六个 y的值:26,18,13,10,4,babababababa.这六个值与表中相应的实际值应该越接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平方和 (,)Q a b是直线 ybxa与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线 ybxa与图中六个点的接近程度,所以,设法取,a b的值,使(,)Q a b达到最小值.这种方法叫做最小平方法(又称最小二乘法).先把a看作常数,
5、那么Q是关于b的二次函数.易知,当14038202 1286ab 时,Q取得最小值.同理,把b看作常数,那么Q是关于a的二次函数.当14046012ba 时,Q取得最小值.因此,当14038202 128614046012abba 时,Q取的最小值,由此解得1.6477,57.5568ba.所求直线方程为1.647757.5568yx.当5x 时,66y,故当气温为50C时,热茶销量约为66杯.2线性相关关系:像能用直线方程 ybxa近似表示的相关关系叫做线性相关关系.3线性回归方程:一般地,设有n个观察数据如下:x 1x 2x 3x nx y 1y 2y 3y ny 当,a b使222112
6、2()().()nnQybxaybxaybxa取得最小值时,就称 ybxa为拟合这n对数据的线性回归方程,该方程所表示的直线称为回归直线.上述式子展开后,是一个关于,a b的二次多项式,应用配方法,可求出使Q为最小值时的,a b的值即 1112211()()()nnniiiiiiinniiiinx yxybnxxaybx,(*)niixnx11,niiyny11 四、数学运用 1例题:例 1 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由 机动车辆数x千台 95 11
7、0 112 120 129 135 150 180 交通事故数y千件 6.2 7.5 7.7 8.5 8.7 9.8 10.2 13 解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系计算相应的数据之和:8888211111031,71.6,137835,9611.7iiiiiiiiixyxx y,将它们代入()式计算得0.0774,1.0241ba,所以,所求线性回归方程为0.07741.0241yx 2练习:(1)第 75 页练习 1、2(2)下列两个变量之间的关系哪个不是函数关系(D )A角度和它的余弦值 B.正方形边长和面积 C正边形的边数和它的内角和
8、D.人 的年龄和身高(3)给出施化肥量对水稻产量影响的试验数据:施化肥量x 15 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455(1)画出上表的散点图;(2)求出回归直线并且画出图形 解:(1)散点图(略)(2)表中的数据进行具体计算,列成以下表格 i 1 2 3 4 5 6 7 xi 15 20 25 30 35 40 45 yi 330 345 365 405 445 450 455 xiyi 4950 6900 9125 12150 15575 18000 20475 3.399,30yx,777221117000,1132725,87175iiiiiiixyx y 故可得到 2573075.43.399,75.430770003.399307871752ab 从而得回归直线方程是4.75257yx(图形略)五、回顾小结:1对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数,a b的计算公式,算出,a b由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误求线性回归方程的步骤:计算平均数yx,;计算iiyx 与的积,求iiyx;计算2ix;将结果代入公式求a;用 xayb求b;写出回归方程 六、课外作业:课本第 75 页习题 2.4 第 1、2、3 题