《统计学第六章相关与回归分析精品文稿.ppt》由会员分享,可在线阅读,更多相关《统计学第六章相关与回归分析精品文稿.ppt(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学第六章相关与回归分析第1页,本讲稿共18页第一节 相关关系一、相关关系 1、函数关系:变量之间具有完全确定的关系,如圆的周长(L)与半径(R)之间的关系(L=2R)。变量之间关系通常可以用数学公式确切地表示。2、相关关系:变量之间存在着非确定性的依赖关系,如家庭可支配收入X与消费支出Y。变量之间关系一般不能用数学公式确切地表示。第2页,本讲稿共18页二、相关关系的种类按相关的方向不同:分正相关和负相关;按相关的形式不同:分线性相关和非线性相关;按影响因素的数量不同:分单相关、复相关和偏相关第3页,本讲稿共18页三、相关分析与回归分析相关分析:是判断变量之间是否具有相关关系的数学分析方法,
2、通常计算变量间的相关系数来实现,此时两个变量均为随机变量回归分析:将计算回归方程为基础的统计分析方法称为回归分析。此时两变量中因变量是一个随机变量,而自变量是一个确定性变量。第4页,本讲稿共18页第二节 相关分析一、相关表与相关图1、相关表:把相关的两个变量的数值,相应地排列而成的一张表格。2、相关表种类:第5页,本讲稿共18页3、相关图相关图也称散点图,是在平面直角坐标系中,以横轴表示变量 x,纵轴表示变量y,将两者对应的数值形成的坐标点在图中标出,即可看出变量之间关系密切程度。如下图,年收入与受教育程度相关图第6页,本讲稿共18页 平均受教育程度与平均年收入散点图第7页,本讲稿共18页二、
3、相关系数含义:用于测定两个变量之间线性相关程度和相关方向的统计分析指标,常用字母r表示。计算公式:相关系数=变量x与y的协方差/变量x的标准差变量y的标准差=xy2/xy(详见教材P146)第8页,本讲稿共18页接前页相关系数特点:取值在-1到+1之间;当r大于零时,为正相关;小于零时,为负相关;当r绝对值接近于零,表示变量间的相关程度越小;当r绝对值越接近于1,表示变量间的相关程度越大。当 r=0时,表明x与y无关系(称零相关)当r绝对值等于1时,变量之间完全相关(或为函数关系)。第9页,本讲稿共18页第三节 一元线性回归分析一元线性回归模型:在回归分析中所形成的变量间的关系式称为回归模型,
4、其中,以一条直线方程表明变量之间相关关系的模型叫一元线性回归模型。一元线性回归模型建立:直线方程的模型为:y=a+bx 式中:y表示因变量y的估计值,x为自变量的实际值,a、b为待定参数,其几何意义:a为直线截距,b为直线斜率。b表示当x每增加1个单位时,y平均增加的数量。b也称回归系数。第10页,本讲稿共18页模型参数的估计方法:最小平方法此部分可参见教材P151要求:根据所给资料绘制出变量间相关图;计算相关系数,并判断变量间相关方向和相关程度;根据最小平方法公式计算参数估计值a、b;建立一元线性回归模型y=a+bx;解释回归系数b的经济意义。第11页,本讲稿共18页举例某企业某种产品产量和
5、单位成本资料如下:月份 1 2 3 4 5 6 合计合计产量产量x(千件)(千件)4 6 8 7 8 9 42单位成本单位成本y(元(元/件)件)73 72 71 72 70 69 427x2 16 36 64 49 64 81 310y2 5329 5184 5041 5184 4900 4761 30399xy 292 432 568 504 560 621 2977第12页,本讲稿共18页接前页要求:(1)根据所给资料,绘制相关散点图,并判别相关关系表现形式和方向;(2)计算相关系数;(3)建立单位成本与产量的一元线性回归模型,并指出回归系数的经济意义。第13页,本讲稿共18页练习题某地
6、高校教育经费某地高校教育经费(x:万元万元)和在校生人数和在校生人数(y:万人万人)资料如下资料如下:_ 在校生数在校生数y 11 16 18 20 22 25_ 教育经费教育经费x 316 343 373 393 418 455_要求:(1)计算相关系数计算相关系数,分析变量间相关程度分析变量间相关程度;(2)建立一元线性回归方程建立一元线性回归方程,并解释方程中回归系数的并解释方程中回归系数的经济意义经济意义;(3)若教育经费达到若教育经费达到500万元时万元时,在校生数可以达到多少在校生数可以达到多少?第14页,本讲稿共18页接前页_ 在校生数在校生数y 11 16 18 20 22 2
7、5 112_ 教育经费教育经费x 316 343 373 393 418 455 2298 x2 99856 117649 139129 154449 174724 207025 892832 y2 121 256 324 400 484 625 2210 xy 3476 5488 6714 7860 9196 11375 44109第15页,本讲稿共18页三、线性回归方程拟合优度的测定判定系数r2:指因变量y的总变动中由x的变动解释或说明的部分所占的比例。估计标准误差:该指标表明y的估计值的代表性大小。数值越大,估计值代表性越小,即相关点的离散程度大;反之,则代表性越小,相关点的离散程度就越小。第16页,本讲稿共18页总结本章主要介绍了回归系数计算方法及判定标准此外,还介绍了一元线性回归模型的参数估计、模型建立以及利用模型对因变量y的预测方法重点是应能够利用所给资料建立线性回归方程(模型)第17页,本讲稿共18页本章要点相关与回归相关分析回归分析相关系数建立回归方程计算相关系数确定待定参数a、b相关图、表解释回归系数b经济意义拟合优度测定第18页,本讲稿共18页