《直线相关与回归课件.ppt》由会员分享,可在线阅读,更多相关《直线相关与回归课件.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、卫生学卫生学第十三章第十三章 直线相关与回归直线相关与回归温州医学院环境与公共卫生学院温州医学院环境与公共卫生学院温州医学院环境与公共卫生学院温州医学院环境与公共卫生学院黄陈平黄陈平黄陈平黄陈平主要内容主要内容 直线相关直线相关 直直线回线回归归 直线相关与回归的区别与联系直线相关与回归的区别与联系 等级相关等级相关1 直线相关的概念直线相关的概念2 2 相关系数的计算相关系数的计算3 3 相关系数的相关系数的假设检验假设检验第一节第一节 直线相关直线相关一、直线相关的概念一、直线相关的概念直线相关(linear correlation):又称简单相关,是探讨服从正态分布的两个随机变量x和y有
2、无线性相关关系的一种统计分析方法。如,研究血糖和胰岛素之间的线性关系如,研究血糖和胰岛素之间的线性关系 u相相关关系系数数(correlation(correlation coefficient)coefficient):又又称称积积差差相相关关系系数数,是是描描述述两两个个变变量量间间线线性性相相关关关关系系的的密密切切程程度度与与方方向向的的统计指标。样本相关系数用统计指标。样本相关系数用r r表示,总体相关系数用表示,总体相关系数用 表示。表示。u相相关关系系数数没没有有单单位位,其其取取值值在在-1-1和和1 1之之间间波波动动。r r值值为为正正表表示示正正相相关关,r r值值为为负
3、负表表示示负负相相关关,r r值值为为零零为为零零相相关关。r r值等于值等于1 1为完全正相关。为完全正相关。r r值等于值等于-1-1表示完全负相关。表示完全负相关。相关系数相关系数图图图图13-1 13-1 13-1 13-1 直线相关示意图直线相关示意图直线相关示意图直线相关示意图 其中其中二、相关系数的计算二、相关系数的计算例例13-1 某某医医生生随随机机抽抽查查了了1212名名糖糖尿尿病病患患者者的的空空腹腹血血糖糖及及胰胰岛岛素素值值,数数据据见见下下表表,试试做做相相关分析。关分析。图图13-2 1213-2 12名糖尿病患者血糖与胰岛素散点及回归直线图名糖尿病患者血糖与胰岛
4、素散点及回归直线图 本例,本例,代入公式,得代入公式,得三、三、相关系数相关系数的假设检验的假设检验 v t t 检验检验 v 查表法查表法 根根据据自自由由度度查查相相关关系系数数r r界界值值表表,查查出出r r0.05,0.05,,若若r r r r0.05,0.05,则则 认认 为为P P 0.050.05,不不 拒拒 绝绝H H0 0,若若r rr r0.05,0.05,则认为则认为P P 0.050.05,拒绝拒绝H H0 0,接受接受H H1 1。第二节第二节 直线回归直线回归1 1 直线回归的概念直线回归的概念2 2 直线回归方程的求法直线回归方程的求法3 3 回归系数的假设检
5、验回归系数的假设检验4 4 回归方程的应用回归方程的应用5 5 注意事项注意事项u直直线线回回归归(linear(linear regression)regression),又又称称简简单单回回归归,是是用用直直线线回回归归方方程程来来描描述述两两个个连连续续型型变变量量x x和和y y之之间间数数量量依依存存关关系系的的一一种种统统计计分析方法。分析方法。一、直线回归的概念一、直线回归的概念 直线回归方程的一般表达式:直线回归方程的一般表达式:为为x 取某固定值时应取某固定值时应变量变量Y Y 总体均数的估总体均数的估计值。计值。a:截距截距b:回归系数,即斜率回归系数,即斜率。注意:直线回
6、归方程与函注意:直线回归方程与函数方程的不同数方程的不同 y=a+bxy=a+bx例例13-2 就就例例13-113-1的的资资料料,现现已已计计算算得得糖糖尿尿病病患患者者的的血血糖糖与与胰胰岛岛素素之之间间存存在在负负相相关关关关系,试继续进行直线回归分析。系,试继续进行直线回归分析。二、直线回归方程的求法二、直线回归方程的求法步骤步骤1 1:绘制散点图:绘制散点图步骤步骤2 2:计算回归系数:计算回归系数b b和截距和截距a a步骤步骤3 3:建立直线回归方程:建立直线回归方程图图13-2 1213-2 12名糖尿病患者血糖与胰岛素散点及回归直线图名糖尿病患者血糖与胰岛素散点及回归直线图
7、 直线回归方程的求解:最小二乘原理直线回归方程的求解:最小二乘原理yx保保证证各各实实测测点点距距回回归归直直线线的的纵纵向向距距离平方和最小,即离平方和最小,即 最小最小。根据最小二乘估计原理根据最小二乘估计原理:得:得:b=-0.3256,a=16.0907根据:根据:b=-0.3256 a=16.0907写出直线回归方程:写出直线回归方程:有意义吗?有意义吗?-假设检验假设检验回归系数也有抽样误差!总体总体0总体总体 0样本样本b0两变量有两变量有直线关系直线关系两变量无两变量无直线关系直线关系?v t 检验检验 回归系数的假设检验与相关系数的假设检验回归系数的假设检验与相关系数的假设检
8、验等价等价 三、回归系数的假设检验三、回归系数的假设检验 称称剩剩余余标标准准差差(residual residual standard standard deviationdeviation),为为各各实实际际值值 y y 与与估估计计值值之之间间的的误误差差,反反映映了了扣扣除除 x x 的的影影响响后后,y y 对对回回归直线的离散程度。归直线的离散程度。1 1检验假设检验假设 H H0 0:=0=0 H H1 1:0 0 =0.05=0.05 2 2计算统计量计算统计量 3 3确定确定P P值,判断结果值,判断结果 查查t t值值表表,t t0.01/2,0.01/2,1010=3.1
9、69=3.169,t tb b t t0.01/2,0.01/2,10 10,P P0.01 r rs s(10(10,0.02)0.02),则,则P P0.020.8115 r r0.01,100.01,10,P P0.01,0.01,按按=0.05=0.05的的水水准准,拒拒绝绝H H0 0 ,接接受受H H1 1,结结论论同同t t 检验检验。例例13-1:查表法查表法r 的平方称为决定系数(的平方称为决定系数(coefficient of determination)回回归归平平方方和和是是由由于于引引入入了了相相关关变变量量而而使使总总平平方方和和减减少少的的部部分分。回回归归平平方方和和越越接接近近总总平平方方和和,则则r r2 2越越接接近近1 1,剩剩余余平平方方和和越越小小,相相关关和和回回归归分分析析的的效果越好效果越好。