《第9章一元线性回归(DA)教学ppt课件数据分析基础—基于Python的实现电子教案.pptx》由会员分享,可在线阅读,更多相关《第9章一元线性回归(DA)教学ppt课件数据分析基础—基于Python的实现电子教案.pptx(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第9章 一元线性回归(DA)教学课件数据分析基础基于Python的实现 电子教案第 1 章1-2统计学Python实现贾俊平2023/5/17贾俊平2023/5/17数据分析基础数据分析基础贾俊平 2023/5/17Fundamentals of data Fundamentals of data analysis with Pythonanalysis with Python基于基于 Python 的实现的实现第 9 章9-3数据分析基础基于Python的实现2023/5/17贾俊平2023/5/179.1 9.1 确定变量间的关系确定变量间的关系9.2 9.2 模型的估计和检验模型的估计和
2、检验9.3 9.3 利用回归方程进行预测利用回归方程进行预测9.4 9.4 回归模型的诊断回归模型的诊断 第 9 章 一元线性回归第 9 章9-4数据分析基础基于Python的实现2023/5/17 9.1 变量间的关系 变量间的关系变量间的关系回归建模需要清楚的问题回归建模需要清楚的问题l建立回归模型时,首先需要弄清楚变量之间的关系l分析变量之间的关系需要解决下面的问题变量之间是否存在关系如果存在,它们之间是什么样的关系变量之间的关系强度如何样本所反映的变量之间的关系能否代表总体变量之间的关系第 9 章9-5数据分析基础基于Python的实现2023/5/17 9.1 变量间的关系 变量间的
3、关系变量间的关系函数关系与相关关系函数关系与相关关系l函数关系对应的确定关系设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量各观测点落在一条线上l相关关系一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值对应着一个分布各观测点分布在直线周围 第 9 章9-6数据分析基础基于Python的实现2023/5/17 9.1 变量间的关系 相关关系的描述相关关系的描述散点图散点图例题分析例题分析【例例9-1】为研
4、究居民家庭消费支出与家庭总收入之间的关系,随机抽取60户家庭,得到他们的家庭消费支出与家庭总收入数据如表9-1所示。绘制散点图描述家庭消费支出与家庭总收入的关系第 9 章9-7数据分析基础基于Python的实现2023/5/17 9.1 变量间的关系 相关关系相关关系关系强度的度量关系强度的度量相关系数相关系数性质与解读性质与解读l度量变量之间线性关系强度的一个统计量若相关系数是根据总体全部数据计算的,称为总体相关系数,记为若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为 r也称为Pearson相关系数(Pearsons correlation coefficient)l样本相
5、关系数的计算公式l性质性质1:r 的取值范围是-1,1|r|=1,为完全相关;r=0,不存在线性相关关系-1r0,为负相关;0|t|0.025 0.975-Intercept 1.894e+04 643.529 29.436 0.000 1.77e+04 2.02e+04居民家庭总收入 0.4725 0.009 53.758 0.000 0.455 0.490=Omnibus:6.328 Durbin-Watson:2.139Prob(Omnibus):0.042 Jarque-Bera(JB):2.477Skew:0.102 Prob(JB):0.290Kurtosis:2.026 Cond
6、.No.2.79e+05=Warnings:1 Standard Errors assume that the covariance matrix of the errors is correctly specified.2 The condition number is large,2.79e+05.This might indicate that there arestrong multicollinearity or other numerical problems.第 9 章9-12数据分析基础基于Python的实现2023/5/17 9.2 一元线性回归 一元线性回归建模一元线性回归
7、建模拟合优度拟合优度误差分解误差分解l总平方和总平方和(SSTtotal sum of squares)反映因变量的 n 个观察值与其均值的总误差l回归平方和回归平方和(SSRsum of squares of regression)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和l残差平方和残差平方和(SSEsum of squares of error)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和第 9 章9-13数据分析基础基于Python的实现2023/5/17
8、 9.2 一元线性回归 一元线性回归建模一元线性回归建模拟合优度拟合优度决定系数决定系数R2估计标准误估计标准误l实际观察值与回归估计值误差平方和的均方根l反映实际观察值在回归直线周围的分散状况l对误差项的标准差的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量l反映用估计的回归方程预测y时预测误差的大小 l计算公式为第 9 章9-14数据分析基础基于Python的实现2023/5/17 9.2 一元线性回归 一元线性回归建模一元线性回归建模模型检验模型检验F 检验检验t 检验检验第 9 章9-15数据分析基础基于Python的实现2023/5/17 9.3 利用回归方程进行预测
9、 回归预测回归预测置信区间和预测区间置信区间和预测区间第 9 章9-16数据分析基础基于Python的实现2023/5/17 9.3 利用回归方程进行预测 回归预测回归预测置信区间和预测区间置信区间和预测区间例题分析例题分析ObsDep Var PopulationPredicted ValueMean ci 95%lowMean ci 95%uppPredict ci 95%lowPredict ci 95%uppResidual014160042097.2541588.0642606.4339430.4844764.01-497.25125950057690.9957298.4158083
10、.5655044.0160337.961809.01235000048003.9747629.6648378.2745359.6450648.291996.03347150073284.7372434.2774135.1870532.3476037.11-1784.73454570045168.7444738.3645599.1242515.8947821.59531.26565450054477.7354130.4254825.0451837.0957118.3722.27674520042579.2342083.3343075.1439914.9745243.492620.77784810
11、049894.1249544.2550243.9847253.1452535.09-1794.12896650066432.9365808.3267057.5463741.7469124.1267.079106150061707.5661221.5162193.659045.1164370-207.5610114360042664.2942170.743157.8840000.4645328.12935.7111124280042475.2841976.5342974.0239810.4845140.07324.7212134085042806.0542316.343295.8140142.9
12、345469.18-1956.0513146200064306.5163746.8564866.1761629.6566983.37-2306.5114154950047767.747389.5348145.8745122.8250412.571732.315164800047460.5547077.1147843.9944814.9150106.18539.4516174850047318.7946932.8247704.7544672.7849964.791181.2117184995049657.8549305.650010.0947016.5552299.14292.151819524
13、0051311.7350971.6851651.7848672.0353951.421088.2719204250042806.0542316.343295.8140142.9345469.18-306.05第 9 章9-17数据分析基础基于Python的实现2023/5/17 9.4 回归模型的模型诊断 模型诊断模型诊断残差与标准化残差残差与标准化残差l残差残差因变量的观测值与预测值之差,用e表示l反映了用估计的回归方程去预测而引起的误差 l可用于确定有关误差项的假定是否成立 l标准化残差标准化残差残差除以它的标准差l残差图残差图模型诊断工具第 9 章9-18数据分析基础基于Python的实现2023/5/17 9.4 回归模型的模型诊断 模型诊断模型诊断例题分析例题分析THE ENDTHE ENDT THHAANNKKS S2023/5/17人人 生生 苦苦 短短我我 用用P Py yt th ho on n