《(51)--第1节直线回归医学统计学.ppt》由会员分享,可在线阅读,更多相关《(51)--第1节直线回归医学统计学.ppt(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1 第一节第一节 直线回归直线回归Linear Regression2 英英国国人人类类学学家家 F.F.GaltonGalton首首次次在在自自然然遗遗传传一一书书中中,提提出出并并阐阐明明了了“回回归归”和和“相相关关”两两个个概概念念,为为相相关关论论奠奠定定了了基础。基础。历史背景历史背景3 儿儿子子身身高高(Y,英英寸寸)与与父父亲亲身身高高(X,英英寸寸)存存在在线线性性关系:关系:高个子父代的子代高个子父代的子代在成年之后的身高平均来说不是更高,在成年之后的身高平均来说不是更高,而是而是稍矮于其父代水平稍矮于其父代水平。矮个子父代的子代矮个子父代的子代的成年之后的平均身高不是更矮
2、,而的成年之后的平均身高不是更矮,而是是稍高于其父代水平。稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之将这种趋向于种族稳定的现象称之“回归回归”。GaltonGalton和英国统计学家和英国统计学家Karl PearsonKarl Pearson对上千个家庭的身高、对上千个家庭的身高、臂长、拃长(伸开大拇指与中指两端的最大长度)做了测臂长、拃长(伸开大拇指与中指两端的最大长度)做了测量。量。4回归(回归(regression)与相关()与相关(correlation)是研究多个变量之间相互关系的一种统计是研究多个变量之间相互关系的一种统计方法,应用较广。方法,应用较广。5编编
3、号号12345678910母血母血TSH水平水平 X1.211.301.391.421.471.561.681.721.982.10脐带血脐带血TSH水平水平 Y3.904.504.204.834.164.934.324.994.705.20表表8-1 母血与新生儿脐带血母血与新生儿脐带血TSH含量(含量(mU/L)例8-1 某某医医生生为为了了探探讨讨缺缺碘碘地地区区母母婴婴TSHTSH水水平平的的关关系系,应应用用免免疫疫放放射射分分析析测测定定孕孕妇妇(15151717周周)及及分分娩娩时时脐脐带带血血TSHTSH水平,随机抽取水平,随机抽取1010对数据如下:对数据如下:一一.直线回归
4、的概念直线回归的概念6描述母血与脐带血中描述母血与脐带血中TSH水平的依存关系的水平的依存关系的散点图散点图7函函数数关关系系:两两事事物物间间一一一一对对应应的的关关系系。即即当当一一个个变变量量 x x取取一一定定值值时时,另另一一变变量量y y可可依依赖赖确确定定的的函函数数取取唯唯一一确确定定的值。的值。函数关系与回归关系函数关系与回归关系回回归归关关系系:两两事事物物间间非非一一一一对对应应的的关关系系。即即当当一一个个变变量量x x取取一一定定值值时时,另另一一变变量量y y无无法法依依赖赖确确定定的的函函数数取取唯唯一一确确定的值。定的值。8直线回归的定义直线回归的定义直线回归是
5、回归分析中最基本、最简单的一种,故又直线回归是回归分析中最基本、最简单的一种,故又直线回归是回归分析中最基本、最简单的一种,故又直线回归是回归分析中最基本、最简单的一种,故又称为简单回归(称为简单回归(称为简单回归(称为简单回归(simple regressionsimple regression)建立两变量间所对应的数量依存关系,如果该关系呈建立两变量间所对应的数量依存关系,如果该关系呈建立两变量间所对应的数量依存关系,如果该关系呈建立两变量间所对应的数量依存关系,如果该关系呈现一种现一种现一种现一种直线趋势直线趋势直线趋势直线趋势,则称为,则称为,则称为,则称为直线回归直线回归直线回归直线
6、回归(linear regression)(linear regression)9 直线回归方程的一般表达式:直线回归方程的一般表达式:上述公式称为上述公式称为经验回归方程经验回归方程或或样本回归方程样本回归方程,它是对,它是对两个变量总体间线性关系的一个估计。两个变量总体间线性关系的一个估计。二二.直线回归方程的求法直线回归方程的求法10 为常数,是回归直线在为常数,是回归直线在Y轴上的轴上的截距截距(intercept)。统计意义是统计意义是当当X X取值为取值为0 0时相应时相应Y Y的均数估计的均数估计。总体的截距。总体的截距用用 表示。表示。为为回回归归系系数数(coefficien
7、t of regression),是是直直线线的的斜斜率率(slope),统统计计意意义义是是当当X X变变化化一一个个单单位位时时Y Y平平均均改改变变b b个个单单位。总体的回归系数用位。总体的回归系数用 表示。表示。11描述母血与脐带血中描述母血与脐带血中TSH水平的依存关系的水平的依存关系的散点图散点图直线确定的基本思想直线确定的基本思想直线确定的基本思想直线确定的基本思想12使使使使各各各各实实实实测测测测点点点点至至至至直直直直线线线线的的的的纵纵纵纵向向向向距距距距离离离离的的的的平平平平方方方方和和和和最最最最小小小小,故故故故又称最小二乘回归又称最小二乘回归又称最小二乘回归又
8、称最小二乘回归(least square method)(least square method)。最小二乘法原理最小二乘法原理 min13根根据据数数学学上上的的最最小小二二乘乘法法原原理理,可可导导出出 、算式如下算式如下 :2直线一定经过直线一定经过直线一定经过直线一定经过“均数均数均数均数”点点点点直线唯一确定直线唯一确定直线唯一确定直线唯一确定14应用实例应用实例 编编 号号12345678910母血母血TSH水平水平 X1.211.301.391.421.471.561.681.721.982.10脐带血脐带血TSH水平水平 Y3.904.504.204.834.164.934.324.994.705.20表表8-1 母血与新生儿脐带血母血与新生儿脐带血TSH含量(含量(mU/L)15(1)由原始数据绘制散点图,如下由原始数据绘制散点图,如下:【分析与解分析与解】16(2)(2)求求17(3)(3)计算计算18(4)求回归系数求回归系数b和截距和截距a(5)列出回归方程列出回归方程19