《相关分析和回归分析(3).ppt》由会员分享,可在线阅读,更多相关《相关分析和回归分析(3).ppt(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第8讲讲 相关分析和回归分析相关分析和回归分析医学统计学医学统计学(Medical Statistics)西南交通大学峨眉校区基础课部数学教研室西南交通大学峨眉校区基础课部数学教研室一、相关分析一、相关分析二、回归分析二、回归分析本讲结构本讲结构 相关系数示意图相关系数示意图 散点呈椭圆形分布,散点呈椭圆形分布,X X、Y Y 同时同时增减增减-正正相关相关(positive correlation)positive correlation);X X、Y Y 此增彼减此增彼减-负负相关相关(negative correlation)(negative correlation)。散点在一条直线
2、上,散点在一条直线上,X X、Y Y 变化趋势变化趋势相同相同-完完全正相关全正相关;反向反向变化变化-完全负相关完全负相关。一、相关分析一、相关分析两个变量两个变量两个变量两个变量Y Y与与与与 X X间间间间的彼此关系的彼此关系的彼此关系的彼此关系 相关分析相关分析相关分析相关分析相关系数示意图相关系数示意图 X X、Y Y 变化互不影响变化互不影响-零零相关相关(zero correlation)(zero correlation)相相关关系系数数(correlation coefficient),对对于于正正态态分分布布资料资料,选择积差相关系数选择积差相关系数,又称又称 Pearso
3、n Pearson 相关系数相关系数.对于非正态分布资料对于非正态分布资料,选择等级相关系数选择等级相关系数(Spearman(Spearman或或KendallKendall相关系数相关系数).).l 相关系数概念相关系数概念相关系数概念相关系数概念 Pearson相关系数计算公式相关系数计算公式:【例例1】相关分析相关分析.sav 分析年龄和片段长度的相关性分析年龄和片段长度的相关性结论结论:两变量存在显著的负相关两变量存在显著的负相关 回归分析回归分析(Regression)是一种应用极为广泛的数量是一种应用极为广泛的数量分析方法。它用于考察一个变量分析方法。它用于考察一个变量(因变量因
4、变量)与其余变量与其余变量(自变量自变量)之间的数量关系,并通过回归方程的形式反之间的数量关系,并通过回归方程的形式反映这种关系映这种关系,进而为控制和预测提供科学依据。进而为控制和预测提供科学依据。一元线性回归一元线性回归(linear regression):自变量只有一个自变量只有一个.多元线性回归多元线性回归(multiple linear regression):自变量自变量有多个有多个.二、回归分析二、回归分析l 一般线性回归的基本步骤一般线性回归的基本步骤(1)确定回归方程中的自变量和因变量;)确定回归方程中的自变量和因变量;(2)确定回归方程形式;)确定回归方程形式;(3)建立
5、回归方程,估计参数;)建立回归方程,估计参数;(4)对回归方程进行各种统计检验;)对回归方程进行各种统计检验;(5)利用回归方程进行预测。)利用回归方程进行预测。l 回归方程的各种模型回归方程的各种模型一元线性回归方程模型一元线性回归方程模型多元线性回归方程模型多元线性回归方程模型可化为线性回归的方程模型可化为线性回归的方程模型1.回归方程的拟合优度检验回归方程的拟合优度检验 决定系数决定系数R2越接近于越接近于1,说明回归方程对样本数据点,说明回归方程对样本数据点拟和得越好拟和得越好.2.回归方程的显著性检验回归方程的显著性检验 检验统计量检验统计量F值越大,则值越大,则P值越小值越小,说明
6、回归方程越显著说明回归方程越显著.3.回归系数的显著性检验回归系数的显著性检验 回归系数对应的检验统计量回归系数对应的检验统计量t的绝对值越大,则相应的的绝对值越大,则相应的P值越小值越小,说明回归系数越显著说明回归系数越显著.特别地特别地,在显著时回归系数在显著时回归系数的置信区间不包含的置信区间不包含0.l 回归方程的各种检验回归方程的各种检验【例例2】回归分析回归分析1.sav 上海医科大学儿科医院研上海医科大学儿科医院研究某种代乳粉的营养价值是用大白鼠做试验,得大白究某种代乳粉的营养价值是用大白鼠做试验,得大白鼠进食量(鼠进食量(g)和体重增量()和体重增量(g)间关系的原始数据。)间
7、关系的原始数据。试对进食量和体重增量进行回归分析。试对进食量和体重增量进行回归分析。体重增量体重增量-17.3570.222进食量进食量l 多元线性回归方程中自变量的选择方法多元线性回归方程中自变量的选择方法 如如果果将将一一些些回回归归效效果果不不显显著著的的自自变变量量引引入入方方程程,会会降降低低模模型型的的精精度度,因因此此需需要要将将其其从从方方程程中中剔剔除除,同同时时应应尽尽可可能能将将回回归归效效果果显显著著的的自自变变量量放放入入方方程程中中;在在需需要要时时,还还可可以以添添加加交交叉叉项项(考考虑虑交交互互效效应应)和和平平方方项项(二二次次函函数数)以以进进一一步步提提高模型的精度和实用性高模型的精度和实用性.哪个模型的调整决定系数哪个模型的调整决定系数RC2大大,哪个模型就优哪个模型就优.逐步回归法逐步回归法:methodstepwise,选用不同的组选用不同的组合进行筛选合进行筛选.【例例3】回归分析回归分析2.sav 牙膏的销售量牙膏的销售量 最佳结果最佳结果:y=29.1133+11.1342x1-7.6.80 x2+0.6712x22-1.4777x1x2R2=0.9209