卫生统计学ppt课件--第十四章--直线回归与相关.ppt

上传人:飞****2 文档编号:73172600 上传时间:2023-02-16 格式:PPT 页数:91 大小:3.02MB
返回 下载 相关 举报
卫生统计学ppt课件--第十四章--直线回归与相关.ppt_第1页
第1页 / 共91页
卫生统计学ppt课件--第十四章--直线回归与相关.ppt_第2页
第2页 / 共91页
点击查看更多>>
资源描述

《卫生统计学ppt课件--第十四章--直线回归与相关.ppt》由会员分享,可在线阅读,更多相关《卫生统计学ppt课件--第十四章--直线回归与相关.ppt(91页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2023/2/15第十四章章 双变量回归与相关双变量回归与相关 simple linear regression simple linear regression and correlationand correlation 2023/2/15 回归分析与相关分析回归分析与相关分析变变量量间间关关系系问问题题:年年龄龄身身高高、肺肺活活量量体体重重、药物剂量与动物死亡率等药物剂量与动物死亡率等。两个关系:两个关系:(1)依依存存关关系系:应应变变量量(dependent variable)Y随随自自变变量量(independentvariable)X变化而变化。变化而变化。回归分析回归分析(2

2、)互依关系:互依关系:应变量应变量Y与自变量与自变量 X间间的彼此关系的彼此关系 相关分析相关分析2023/2/15 第一节第一节直线回归直线回归第二节第二节直线相关直线相关第三节第三节Spearman等级相关等级相关(秩相关)(秩相关)第四节第四节秩回归秩回归第五节第五节加权直线回归加权直线回归第六节第六节两条回归直线的比较两条回归直线的比较第七节第七节曲线回归曲线回归2023/2/15 实实例例例例14-1 某地方病研究所调查了某地方病研究所调查了 8名正常儿童的尿肌酐名正常儿童的尿肌酐含量(含量(mmol/24h)如表)如表9-1。估计尿肌酐含量。估计尿肌酐含量(Y)对其年龄()对其年龄

3、(X)的回归方程。)的回归方程。表表14-1 8名正常儿童的年龄名正常儿童的年龄 X(岁岁)与尿肌酐含量与尿肌酐含量 Y(mmol/24h)编号编号12345678年龄年龄X131196810127尿肌酐含量尿肌酐含量Y3.543.013.092.482.563.363.182.652023/2/15 2023/2/15 第一节第一节直线回归直线回归函数关系函数关系函数关系函数关系:确定。例如确定。例如园周长与半径:园周长与半径:y=2r回回回回归归归归关关关关系系系系:不不确确定定。例例如如血血压压和和年年龄龄的的关关系系,称称为为直直线线回归回归(linearregression)。目的目

4、的:建立直线回归方程建立直线回归方程(linearregressionequation)2023/2/15 “回归回归”名称的由来名称的由来 英国统计学家英国统计学家英国统计学家英国统计学家F F GaltonGalton(182218221911 1911 年)和他年)和他年)和他年)和他的学生、现代统计学的奠基者之一的学生、现代统计学的奠基者之一的学生、现代统计学的奠基者之一的学生、现代统计学的奠基者之一K K Pearson(1856Pearson(18561936 1936 年年年年)在研究父母身高与其子女身高的遗传问题在研究父母身高与其子女身高的遗传问题在研究父母身高与其子女身高的遗

5、传问题在研究父母身高与其子女身高的遗传问题时,观察了时,观察了时,观察了时,观察了1078 1078 对夫妇,以每对夫妇中父亲的身高对夫妇,以每对夫妇中父亲的身高对夫妇,以每对夫妇中父亲的身高对夫妇,以每对夫妇中父亲的身高作为解释变量作为解释变量作为解释变量作为解释变量X X,而取他们的一个成年儿子的身高作,而取他们的一个成年儿子的身高作,而取他们的一个成年儿子的身高作,而取他们的一个成年儿子的身高作为被解释变量为被解释变量为被解释变量为被解释变量Y Y(应变量),将结果在平面直角坐标(应变量),将结果在平面直角坐标(应变量),将结果在平面直角坐标(应变量),将结果在平面直角坐标系上绘成散点图

6、,发现趋势近乎一条直线。计算出系上绘成散点图,发现趋势近乎一条直线。计算出系上绘成散点图,发现趋势近乎一条直线。计算出系上绘成散点图,发现趋势近乎一条直线。计算出的回归直线方程为的回归直线方程为的回归直线方程为的回归直线方程为 :2023/2/15 Galton数据散点图(英寸)数据散点图(英寸)2023/2/15 其他类型的散点图其他类型的散点图XYXYX00000YXYXYXY2023/2/15 一、一、直线回归方程直线回归方程 一般表达式一般表达式:或或a:截距:截距(intercept),直线与,直线与Y轴交点的纵坐标轴交点的纵坐标(X0)。b:斜率:斜率(slope),回归系数,回归

7、系数(regressioncoefficient)。意义:意义:X每改变一个单位,每改变一个单位,Y平均改变平均改变b个单位个单位。b0,Y随随X的的增大增大而而增大(减少增大(减少而而减少)减少)斜上;斜上;b F Model 1 0.81343 0.81343 20.97 0.0038 Error 6 0.23276 0.03879 Corrected Total 7 1.04619 Root MSE 0.19696 R-Square 0.7775 Dependent Mean 2.98375 Adj R-Sq 0.7404 Coeff Var 6.60107 Parameter Esti

8、mates Parameter Standard Variable DF Estimate Error t Value Pr|t|95%Confidence Limits Intercept 1 1.66167 0.29700 5.59 0.0014 0.93494 2.38840 x 1 0.13917 0.03039 4.58 0.0038 0.06480 0.213532023/2/15 The REG Procedure Model:MODEL1 Dependent Variable:y Output Statistics Dep Var Predicted Std Error Obs

9、 y Value Mean Predict 95%CL Mean 95%CL Predict Residual 1 3.5400 3.4708 0.1271 3.1597 3.7819 2.8972 4.0445 0.0692 2 3.0100 3.1925 0.0832 2.9888 3.3962 2.6693 3.7157 -0.1825 3 3.0900 2.9142 0.0713 2.7398 3.0886 2.4016 3.4267 0.1758 4 2.4800 2.4967 0.1271 2.1856 2.8078 1.9230 3.0703 -0.0167 5 2.5600 2

10、.7750 0.0832 2.5713 2.9787 2.2518 3.2982 -0.2150 6 3.3600 3.0533 0.0713 2.8789 3.2277 2.5408 3.5659 0.3067 7 3.1800 3.3317 0.1031 3.0795 3.5839 2.7877 3.8756 -0.1517 8 2.6500 2.6358 0.1031 2.3836 2.8880 2.0919 3.1798 0.0142 Sum of Residuals 0 Sum of Squared Residuals 0.23276 Predicted Residual SS(PR

11、ESS)0.342202023/2/15 Pearson Correlation Coefficients,N=8 Prob|r|under H0:Rho=0 x y x 1.00000 0.88177 0.0038 y 0.88177 1.00000 0.0038 Spearman Correlation Coefficients,N=8 Prob|r|under H0:Rho=0 x y x 1.00000 0.85714 0.0065 y 0.85714 1.00000 0.00652023/2/15 SPSS实现直线回归与相关实现直线回归与相关(一)直线回归分析数据格式:1个自变量“x

12、”,1个因变量“y”。Analyze RegressionLinear Dependent:y Independent(s)x Statistics Estimates Confidence Interval Model fit(二)直线相关分析Analyze Correlate BivariateVariables:x/yCorrelation Coefficients Pearson Spearman宇传华 制作(http:/)Curve fitting 曲线拟合曲线拟合 医学研究中,医学研究中,X X与与Y Y两变量的数量关系并两变量的数量关系并非总是线性的,如非总是线性的,如毒物剂量毒

13、物剂量动物死亡率动物死亡率年龄年龄身高身高时间时间血血药物浓度药物浓度 可用可用曲线直线化估计曲线直线化估计(Curve estimation)(Curve estimation)或或 非线性回归非线性回归(Nonlinear regression)(Nonlinear regression)方法进行统计学分析。方法进行统计学分析。绘制散点图,根据图形和专业知识选取绘制散点图,根据图形和专业知识选取曲线类曲线类型型(可同时选取几类)(可同时选取几类)按按曲线类型曲线类型,作曲线直线化变换,作曲线直线化变换建立变换数据间的建立变换数据间的直线回归方程直线回归方程直线回归方程直线回归方程 (假设检

14、验,计算决定系数)比较比较决定系数决定系数选取选取“最佳最佳”方程方程写出曲线方程写出曲线方程曲线直线化估计的步骤曲线直线化估计的步骤 常见的曲线回归方程常见的曲线回归方程 对数:幂函数:或 指数函数:多项式:或 logistic:或 一、利用线性回归拟合曲线(例1)例例 上海医科大学微生物学教研室以已知浓度上海医科大学微生物学教研室以已知浓度X的免疫球蛋的免疫球蛋白白A(IgA,g/ml)作火箭电泳作火箭电泳,测得火箭高度测得火箭高度Y(mm)如表如表1所示。试拟合所示。试拟合Y关于关于X的非线性回归方程。的非线性回归方程。编号编号编号编号 XYXYXXXXlnXlnXlnXlnX 10.2

15、7.6-1.609410.27.6-1.609420.412.3-0.916320.412.3-0.916330.615.7-0.510830.615.7-0.510840.818.2-0.223140.818.2-0.223151.018.7051.018.7061.221.40.182361.221.40.182371.422.60.336571.422.60.336581.623.80.470081.623.80.4700合计合计合计合计140.3-2.2708140.3-2.2708 (一)绘制散点图,决定曲线类型绘制散点图,决定曲线类型(二)曲线直线化变换(二)曲线直线化变换 =a+

16、blnX (三)建立直线回归方程XYXYXXXXlnXlnXlnXlnX(lnX)2Y2(lnX)Y残差平方残差平方 0.27.6-1.60940.27.6-1.60940.412.3-0.91630.412.3-0.91630.615.7-0.51080.615.7-0.51080.818.2-0.22310.818.2-0.22311.018.701.018.701.221.40.18231.221.40.18231.422.60.33651.422.60.33651.623.80.47001.623.80.4700合计合计合计合计140.3-2.2708140.3-2.27082.590

17、2 57.76 -12.2314 2.5902 57.76 -12.2314 0.8396 151.29 -11.2705 0.8396 151.29 -11.2705 0.2609 246.49 -8.0196 0.2609 246.49 -8.0196 0.0498 331.24 -4.0604 0.0498 331.24 -4.0604 0.0000 349.69 0.0000 0.0000 349.69 0.0000 0.0332 457.96 3.9012 0.0332 457.96 3.9012 0.1132 510.76 7.6049 0.1132 510.76 7.6049 0

18、.2209 566.44 11.1860 0.2209 566.44 11.1860 4.10784.1078 2671.632671.63 -12.8898-12.8898 7.23 12.62 15.77 18.01 19.75 21.16 22.36 23.40 0.1380 0.1017 0.0053 0.0361 1.0921 0.0563 0.0566 0.1597 1.6458 (四)比较决定系数,确定“最佳”方程 表表9-11 15名重伤病人的住院天数名重伤病人的住院天数X与预后指数与预后指数Y编编号号1 1 1 12 2 2 23 3 3 34 4 4 45 5 5 56 6

19、 6 67 7 7 78 8 8 89 9 9 9 10101010 11111111 12121212 13131313 14141414 15151515X X2 2 2 25 5 5 57 7 7 7 10101010 14141414 19191919 26262626 31313131 34343434 38383838 45454545 5252525253535353 60606060 65656565Y Y54545454 50505050 45454545 37373737 35353535 25252525 20202020 16161616 18181818 131313

20、138 8 8 8 111111118 8 8 84 4 4 46 6 6 6一、利用线性回归拟合曲线(例2)(一)绘制散点图,决定曲线类型绘制散点图,决定曲线类型 (二)曲线直线化变换 (三)建立线性回归方程线性回归方程 (四)比较决定系数,确定“最佳”方程 二、非线性回归方程线性回归方程 非线性回归与一般线性回归的求解方法不同非线性回归与一般线性回归的求解方法不同在于:在于:1.需要给定参数(需要给定参数(a、b)的初始值)的初始值2.采用迭代方法,不断更新估计的参数,采用迭代方法,不断更新估计的参数,直至稳定在某一值为止。直至稳定在某一值为止。优点:优点:在需要变换在需要变换Y时,结果更

21、可靠。时,结果更可靠。缺点:缺点:a.计算复杂;计算复杂;b.初始值不适当时,估计不准初始值不适当时,估计不准确确.2023/2/15 曲线直线化与非线性回归的决定系数例1例2方法曲线直线化 非线性曲线直线化 非线性直线直线0.93910.93910.93910.9391 0.88560.88560.88560.8856对数函数对数函数0.99220.99220.99220.99220.96540.96540.96540.9654幂函数幂函数0.98230.98230.98420.98420.82930.82930.84130.8413指数指数0.84250.84250.87920.87920

22、.95510.95510.98750.9875 结果不相同原因:结果不相同原因:Y Y变换后变换后(如如lnYlnY),不能保证,不能保证残残差平方和差平方和 最小。最小。曲线直线化曲线直线化 非线性最小二乘法非线性最小二乘法 问题问题:前一个例子只对自变量作对数:前一个例子只对自变量作对数变换的变换的对数曲线对数曲线拟合拟合,能否保证原变量,能否保证原变量Y Y与其估计值与其估计值 之间的残差平方和之间的残差平方和也是最小?也是最小?幂函数曲线幂函数曲线拟合呢?拟合呢?线性(直线)线性(直线)X X 与与 Y Y 间相关系数的平方间相关系数的平方对数曲线对数曲线 lnXlnX与与 Y Y 间

23、相关系数的平方间相关系数的平方幂曲线幂曲线 lnXlnX与与lnYlnY 间相关系数的平方间相关系数的平方指数曲线指数曲线 X X 与与lnYlnY 间相关系数的平方间相关系数的平方三、决定系数的计算三、决定系数的计算(曲线直线化)(曲线直线化)Y Y 与与 间的间的 相关系数相关系数 的平方的平方三、决定系数的三、决定系数的通用通用计算方法计算方法 适用于直线回归曲线直线化回归非线性回归多元回归 Y Y Y Y 与与与与 间的相关系数间的相关系数间的相关系数间的相关系数 等于等于等于等于Y Y Y Y与与与与X X X X间的相关系数;间的相关系数;间的相关系数;间的相关系数;问:问:问:问

24、:1.1.与与与与X X X X间的相关系数等于多少?间的相关系数等于多少?间的相关系数等于多少?间的相关系数等于多少?2.2.残差残差残差残差 与与与与X X间的相关系数等于多少?间的相关系数等于多少?间的相关系数等于多少?间的相关系数等于多少?对于对于 幂函数曲线与指数函数曲线幂函数曲线与指数函数曲线 (特定:特定:Y Y被变换被变换)等,如果条件允许等,如果条件允许最好采用非线性回归(最好采用非线性回归(Nonlinear Regression)拟合)拟合 注意注意绘制散点图,并结合专业知识绘制散点图,并结合专业知识解释;在难以确定采用何种曲线类型解释;在难以确定采用何种曲线类型时,选择多条曲线拟合。时,选择多条曲线拟合。采用采用SASSAS进行曲线拟合进行曲线拟合 采用采用SPSSSPSS进行曲线拟合进行曲线拟合曲线直线化Analyze Regression Curve Estimation 可选Power、Logarithmic、Exponential、Quadratic、Cubic 等 非线性回归Analyze Regression Nonlinear 设置模型:Model Expression 参数赋初值:Parameters

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁