《Excel回归分析结果的详细阐释.pdf》由会员分享,可在线阅读,更多相关《Excel回归分析结果的详细阐释.pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-ExExelel 回归分析结果的详细阐释回归分析结果的详细阐释利用 Excel 的数据分析进行回归,可以得到一系列的统计参量。下面以连续0 年积雪深度和灌溉面积序列(图)为例给予详细的说明。图图 1 1 连续连续 1 1年的最大积雪深度与灌溉面积年的最大积雪深度与灌溉面积(971971980980)回归结果摘要(Summary Outp)如下(图 2):图图 2 2 利用数据分析工具得到的回归结果利用数据分析工具得到的回归结果-第一部分:回归统计表这一部分给出了相关系数、测定系数、校正测定系数、标准误差和样本数目如下(表 1):表表 1 1 回归统计表回归统计表逐行说明如下:Multiple
2、 对应的数据是相关系数(crreltionoeficie),即 R0.9416。R Squre 对应的数值为测定系数(tminaion coeficient),或称拟合优度(oneso it),它是相关系数的平方,即有=0.989416=.98944。Adused 对应的是校正测定系数(adusteddeermination oeficient),计算公式为(n 1)(1 R2)Ra1n m 1式中为样本数,m 为变量数,为测定系数。对于本例,10,m=1,R 0.98944,代入上式得Ra1(101)(10.978944)0.97631210111SSen m 1标准误差(stard err
3、)对应的即所谓标准误差,计算公式为s 这里 SSe 为剩余平方和,可以从下面的方差分析表中读出,即有Se16.1066,代入上式可得s 1*16.10676 1.41892410 11最后一行的观测值对应的是样本数目,即有=1。第二部分,方差分析表方差分析部分包括自由度、误差平方和、均方差、F 值、P 值等(表)。表表 方差分析表(方差分析表(ANOVA)ANOVA)逐列、分行说明如下:第一列 df 对应的是自由度(dere offreedom),第一行是回归自由度fr,等于变量数目,即 dfr=m;第二行为残差自由度e,等于样本数目减去变量数目再减1,即有 dfe=n-m-;第三行为总自由度
4、 dt,等于样本数目减,即有dftn-1。对于本例,=0,因此,fr=1,fe=m-=8,df1=。第二列对应的是误差平方和,或称变差。第一行为回归平方和或称回归变差SSr,即有i yi)2 748.8542SSr(yi1n它表征的是因变量的预测值对其平均值的总偏差。第二行为剩余平方和(也称残差平方和)或称剩余变差SSe,即有i)216.10676SSe(yi yi1n它表征的是因变量对其预测值的总偏差,这个数值越大,意味着拟合的效果越差。上述的 y的标准误差即由Se 给出。第三行为总平方和或称总变差SSt,即有SSr(yi yi)2 764.961i1n它表示的是因变量对其平均值的总偏差。容
5、易验证 7.8+16.1067=76461,即有SSr SSe SSt而测定系数就是回归平方和在总平方和中所占的比重,即有R2SSr748.8542 0.978944SSt764.961显然这个数值越大,拟合的效果也就越好。第四列 M对应的是均方差,它是误差平方和除以相应的自由度得到的商。第一行为回归均方差Sr,即有MSr 第二行为剩余均方差 MS,即有SSr748.8542 748.8542dfr1SSe16.10676 2.013345dfe8MSe 显然这个数值越小,拟合的效果也就越好。第四列对应的是 F 值,用于线性关系的判定。对于一元线性回归,F 值的计算公式为F R21(1 R2)
6、n m 1dfeR21 R2式中 R20.9944,dfe=01-1=8,因此F 8*0.978944 371.945310.978944第五列 Significac F 对应的是在显著性水平下的 F临界值,其实等于值,即弃真概率。所谓“弃真概率”即模型为假的概率,显然 1-P 便是模型为真的概率。可见,P 值越小越好。对于本例,=0.0000005420.000,故置信度达到9.99%以上。-第三部分,回归参数表回归参数表包括回归模型的截距、斜率及其有关的检验参数(表)。表表 3 3回归参数表回归参数表第一列oeffiints 对应的模型的回归系数,包括截距 a2.36437929 和斜率
7、b=.91065,由此可以建立回归模型i 2.3564 1.8129xiy或yi 2.3564 1.8129xiia或s b表示)第二列为回归系数的标准误差(用s,误差值越小,表明参数的精确度越高。这个参数较少使用,只是在一些特别的场合出现。例如L.enuiui 等人在 Whenndwhere ia city frcta?一文中将斜率对应的标准误差值作为分形演化的标准,建议采用4 作为分维判定的统计指标(参见 EB00)。不常使用标准误差的原因在于:其统计信息已经包含在后述的检验中。第三列 tat 对应的是统计量 t 值,用于对模型参数的检验,需要查表才能决定。值是回归系数与其标准误差的比值,
8、即有ta根据表 3 中的数据容易算出:ab,tbbassta2.3564381.8129211.289167,tb19.285881.8278760.094002对于一元线性回归,t 值可用相关系数或测定系数计算,公式如下t R1 Rn m12将 R=0.89416、=、m1 代入上式得到t 0.98941610.9894161011219.28588对于一元线性回归,值与t 值都与相关系数R 等价,因此,相关系数检验就已包含了这部分信息。但是,对于多元线性回归,t 检验就不可缺省了。第四列 P valu对应的是参数的 P 值(双侧)。当 P00时,可以认为模型在 =0.05-的水平上显著,或
9、者置信度达到5%;当 P001 时,可以认为模型在=1 的水平上显著,或者置信度达到 99;当 P0.001 时,可以认为模型在.01 的水平上显著,或者置信度达到9。对于本例,=0.000542.0001,故可认为在=0.001 的水平上显著,或者置信度达到 99.。P 值检验与值检验是等价的,但值不用查表,显然要方便得多。最后几列给出的回归系数以 9%为置信区间的上限和下限。可以看出,在 0的显著水平上,截距的变化上限和下限为-1.85865 和.7153,即有1.85865 a 6.57153斜率的变化极限则为 15615 和 2.026,即有1.59615 b 2.02969第四部分,
10、残差输出结果这一部分为选择输出内容,如果在“回归”分析选项框中没有选中有关内容,则输出结果不会给出这部分结果。i表示),残差输出中包括观测值序号(第一列,用表示),因变量的预测值(第二列,用y残差(residuls,第三列,用 e表示)以及标准残差(表 4)。表表 4 4 残差输出结果残差输出结果预测值是用回归模型i 2.3564 1.8129xiy计算的结果,式中 xi即原始数据的中的自变量。从图可见,x=15.2,代入上式,得1 2.3564 1.8129x1 2.35641.8129*15.2 29.91284y其余依此类推。残差 ei的计算公式为iei yi y从图 1 可见,y1=8
11、.6,代入上式,得到1 28.6 29.91284 1.31284e1 y1 y其余依此类推。标准残差即残差的数据标准化结果,借助均值命令 ava和标准差命令 ste容易验证,残差的算术平均值为0,标准差为 1.337774。利用求平均值命令 sadize(残-差的单元格范围,均值,标准差)立即算出表 4 中的结果。当然,也可以利用数据标准化公式zi*zi zvar(zi)zi zi逐一计算。将残差平方再求和,便得到残差平方和即剩余平方和,即有i)216.10676SSe e(yi y2ii1i1nn利用 Ece的求平方和命令umsq 容易验证上述结果。以最大积雪深度i为自变量,以残差 ei为
12、因变量,作散点图,可得残差图(图 3)。残差点列的分布越是没有趋势(没有规则,即越是随机),回归的结果就越是可靠。i为因变量,作散点图,可得用最大积雪深度为自变量,用灌溉面积 yi及其预测值y线性拟合图(图 4)。最大积雪深度x(米)Residual Plot321残差0-1-2-3最大积雪深度x(米)图图 3 3残差图残差图051015202530最大积雪深度x(米)Line Fit Plot60灌溉面积y(千亩)5040302010001020最大积雪深度x(米)30灌溉面积y(千亩)预测 灌溉面积y(千亩)-图图 4 4线性拟合图线性拟合图第五部分,概率输出结果在选项输出中,还有一个概率
13、输出(robailty Outu)表(表 5)。第一列是按等差数列设计的百分比排位,第二列则是原始数据因变量的自下而上排序(即从小到大)选中图中的第三列(C 列)数据,用鼠标点击自下而上排序按钮列数值。当然,也可以沿着主菜单的“数据(),立即得到表 5 中的第二排序(S)”路径,打开数据排序选项框,进行数据排序。用表 5 中的数据作散点图,可以得到Excl 所谓的正态概率图(图 5)。表表 概率输出表概率输出表Normal Probability Plot60灌溉面积y(千亩)504030201000204060Sample Percentile图图 5 5正态概率图正态概率图80100【几点说明】第一,多元线性回归与一元线性回归结果相似,只是变量数目 m,值和值等统计量与 R 值也不再等价,因而不能直接从相关系数计算出来。第二,利用 SPSS 给出的结果与 Excel 也大同小异。当然,SPS 可以给出更多的统计量,如W 值。在表示方法上,SPSS 也有一些不同,例如 P Vl(值)用ig.(显著性)表征,因为二者等价。只要能够读懂xcel 的回归-摘要,就可以读懂 SSS 回归输出结果的大部分内容。-