《Excel数据分析工具进行多元回归分析范文.doc》由会员分享,可在线阅读,更多相关《Excel数据分析工具进行多元回归分析范文.doc(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 WORD完美格式编辑 使用Excel数据分析工具进行多元回归分析使用Excel数据分析工具进行多元回归分析与简单的回归估算分析方法基本相同。但是由于有些电脑在安装办公软件时并未加载数据分析工具,所以从加载开始说起(以Excel2010版为例,其余版本都可以在相应界面找到)。点击“文件”,如下图:在弹出的菜单中选择“选项”,如下图所示:在弹出的“选项”菜单中选择“加载项”,在“加载项”多行文本框中使用滚动条找到并选中“分析工具库”,然后点击最下方的“转到”,如下图所示:在弹出的“加载宏”菜单中选择“分析工具库”,然后点击“确定”,如下图所示:加载完毕,在“数据”工具栏中就出现“数据分析”工具库
2、,如下图所示:给出原始数据,自变量的值在A2:I21单元格区间中,因变量的值在J2:J21中,如下图所示:假设回归估算表达式为:试使用Excel数据分析工具库中的回归分析工具对其回归系数进行估算并进行回归分析:点击“数据”工具栏中中的“数据分析”工具库,如下图所示:在弹出的“数据分析”-“分析工具”多行文本框中选择“回归”,然后点击“确定”,如下图所示:弹出“回归”对话框并作如下图的选择:上述选择的具体方法是:在“Y值输入区域”,点击右侧折叠按钮,选取函数Y数据所在单元格区域J2:J21,选完后再单击折叠按钮返回;这过程也可以直接在“Y值输入区域”文本框中输入J2:J21;在“X值输入区域”,
3、点击右侧折叠按钮,选取自变量数据所在单元格区域A2:I21,选完后再单击折叠按钮返回;这过程也可以直接在“X值输入区域”文本框中输入A2:I21;置信度可选默认的95%。在“输出区域”如选“新工作表”,就将统计分析结果输出到在新表内。为了比较对照,我选本表内的空白区域,左上角起始单元格为K10.点击确定后,输出结果如下:第一张表是“回归统计表”(K12:L17):其中:Multiple R:(复相关系数R)R2的平方根,又称相关系数,用来衡量自变量x与y之间的相关程度的大小。本例R=0.9134表明它们之间的关系为高度正相关。(Multiple:复合、多种)R Square:复测定系数,上述复
4、相关系数R的平方。用来说明自变量解释因变量y变差的程度,以测定因变量y的拟合效果。此案例中的复测定系数为0.8343,表明用用自变量可解释因变量变差的83.43%Adjusted R Square:调整后的复测定系数R2,该值为0.6852,说明自变量能说明因变量y的68.52%,因变量y的31.48%要由其他因素来解释。(Adjusted:调整后的)标准误差:用来衡量拟合程度的大小,也用于计算与回归相关的其它统计量,此值越小,说明拟合程度越好观察值:用于估计回归方程的数据的观察值个数。第二张表是“方差分析表”:主要作用是通过F检验来判定回归模型的回归效果。该案例中的Significance
5、F(F显著性统计量)的P值为0.00636,小于显著性水平0.05,所以说该回归方程回归效果显著,方程中至少有一个回归系数显著不为0.(Significance:显著)第三张表是“回归参数表”:K26:K35为常数项和b1b9的排序默认标示。L26:L35为常数项和b1b9的值,据此可得出估算的回归方程为:该表中重要的是O列,该列的O26:O35中的P-value为回归系数t统计量的P值。值得注意的是:其中b1、b7的t统计量的P值为0.0156和0.0175,远小于显著性水平0.05,因此该两项的自变量与y相关。而其他各项的t统计量的P值远大于b1、b7的t统计量的P值,但如此大的P值说明这
6、些项的自变量与因变量不存在相关性,因此这些项的回归系数不显著。回归分析是一种应用很广的数量分析方法,用于分析事物间的统计关系,侧重数量关系变化。回归分析在数据分析中占有比较重要的位置。一元线性回归模型:指只有一个解释变量的线性回归模型,用来揭示被解释变量与另一个解释变量的线性关系。多元线性回归模型:指含有多个揭示变量的线性回归模型,用来揭示被解释变量与多个解释变量的线性关系。此篇文章主要讲述多元线性回归分析。方法/步骤线性回归分析的内容比较多,比如回归方程的拟合优度检验、回归方程的显著性检验、回归系数的显著性检验、残差分析、变量的筛选问题、变量的多重共线性问题。操作见图。回归分析通常需要多次试
7、验操作才可以得出较好的模型。“方法”中选择“进入”,表示所有的自变量都进入模型,目前还没有考虑到变量的多重共线问题,要先观察初步的结果分析,才会考虑发哦变量的多重共线问题。1. 3通过观察调整后的判定系数0.924,拟合优度较高,不被解释的变量较少。由回归方程显著性检验的概率为0,小于显著性水平0.05,则认为系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性方程。由系数表知,观察回归系数显著性检验中的概率值,如果显著性水平为0.05,除去“投入人年数”外,其他变量均大于显著性水平,这些变量保留在方程中是不正确的。所以该模型不可用,应重新建模。2. 4重新建模操作见图片,采
8、用的是“向后筛选”方法,依次剔除的变量是专著数、投入高级职称的人年数、投入科研事业费、获奖数、论文数。最后的模型结果是“立项课题数=-94.524+0.492x投入人年数”。3. 5残差分析:又P-P图可知,原始数据与正态分布的不存在显著的差异,残差满足线性模型的前提要求。由库克距离(0.041小于1)和杠杆指变量的值知,没有显著的差异。残差点在0线周围随机分布。END经验内容仅供参考,如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士。12士 士领 询详议域 学律其 题决 需,考 布机围0 异 差有,的美变和于编 (求 提前 线满异 的在布正与 始 图析”年入 .
9、.= 数“ 果的最 文奖费事投 、的高投专变除,”筛“用图操模建应可该所的是在保些水显大变外”入去0为水著值率验显归察知程性立,是性体变与量,为数系 0水显0概的显方少量的不较合拟 0的调题题共变虑考分结察观题重量虑有还型进量的,入择中方型好以作次需析归题问重量、筛量分、性的系回著程回检合的回,比内归步析析性多要章系性的解与释示揭,性的变多:归系性的解一量被来型回的量个指模性置的较有分在归化关量系计物分于法数很种是著不归项此,在不与自些明 此值的 远的计项各而与自两因 .著于 0 0 量的 中是的值 计数归 -的 的,是重为程的出可值 项 示标排 项为 ”表回表著显 0著数回一程,效回回以 0
10、平于 . )性 中果效的归判验通要”析“表数个观的方估用越程合,值计统的归算也大度衡用的的调 (解因他要 变 因能自说 .该,数的整 差释解自明 0定的案果的量测度差量释量自。的数复,定: 种多: 相高系之明表.=。的度的与量衡,关称根平)系( 中) (表回是下果结后确 格始上域空表我,比内在出析分,表新如域% 认可 中文”入在以程这钮叠击选 域单所变取按侧点域入 入文域值在以程这返折单选, 域单所数取钮折点域输值是是具择择如框”示所,确“点归择框行多析-分的示所,工析“中具数析分进估行归具析回具工据 为式算示图如 :值变,间元 的自数示示,具”据出中据数毕示所如确击点库析择中”“示图,到方下
11、点库具中选条使本文项“项加择单“示示,选择单图如件)界相本版,0 (始开所具分加时软办电些由同基析归单简回行工据 分归多工分 理业 多分据行析由办加具(0版相件单选单项“使中点到“择库击示中据,数 ,: 式 工回归析数工示-行归点示”如是输折取 ,返在文入域按所 选这在”中可%新析内我域格后下回 中(系称量的=明高 : 定的。差量的定 释 的.说 要他 的度算统值越方的“”验效 .于 回,回 著”项排 项可出重 归值中 于两而计远的 些在项著很数计关在较的指的型解的归性,解系多析内比检著的分量问归作好中的型有题观虑题的0不少的显水系量性立知归值为去”水保是应模“”专的、费果= 入析与在线求 的差围 考题域询士 专业资料整理