《EXCEL中的回归分析在气候统计中的应用.pdf》由会员分享,可在线阅读,更多相关《EXCEL中的回归分析在气候统计中的应用.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2 0 0 5年第 1期 第2 9 卷 贵州气象 J o u r n a l O f G u i z h o u Me t e o r o l o g y Vo L 2 9 NO 1 现的迅速发展和变化。这里运用红外云图,分析造 成此次过程的冷锋云系在卫星云图上的变化。5月 2日2 0时红外云图上,在 3 5。N以北有一 条明显的东西向云带,这就是冷锋云系。从云图上 可看到,该云系强度较强,云顶温度大部分在 一 6 0 cI=左右,最冷的云顶温度接近 一 7 0 C。该冷锋 的前锋 云系已到四川北部,四川中部到北部为中低云系控 制,我区由于受热低 压控制为晴空区。至 3日 1 0 时,整个冷锋
2、云带 已东移南下影响到我区,强度有所 较弱,主力位置偏东偏北,但在 1 0 0。E、3 5。N附近仍 有一些冷锋云系,强度较弱,表明不断有冷空气南下 补充。2 2 2 数值预报分析对这次我省 出现强降温天 气过程中,欧洲中心和 T 2 1 3 数值预报都作出准确的 预报,基于 5月 2日2 0时高度场和温度场(图略)2 4 h和4 8 h预报,在 5 0 0 h P a 高度场上,1 1 0。E1 1 0。E有一深厚的东西向高空槽,槽后为较强 的西北气 流,引导强冷空气从正北方向南下,即 2 4 h有冷空气 影响我区。8 5 0 h P a 温度场上,2 4 h 1 6。线从位于四川 南部到我
3、省北部边缘,8。线位于中部偏北地区,我区 处于 4。线和 8。线之间,较 2日有所下降(即 5月 3 日的温度比2日温度下降明显,降辐为 8 C 左右)。这与实况吻合。3 结语 通过本文的分析总结,证 明此次强降温天气 过程中,高空槽、中、低层的低涡切变配合较好,引导 冷空气南下非常有利。欧洲中心和 T 2 1 3数值预报产品对高空槽 的 移向、移速以及温度的降辐预报有一定的参考作用。参考文献 1 赵恕,等 贵州省短期天气预报指导手册 z 2 彭安仁,等 天气学 M 北京:气象出版社 3 4 文章编号:1 0 0 3 6 5 9 8(2 0 0 5)0 1 0 0 3 4 0 4 E x c
4、e l 中的回归分析在 气候统计中的应用 左利芳,仇财兴(1 长沙理工大学,湖南 长沙4 1 0 0 0 7;2 湖南省气象局,湖南 长沙4 1 0 0 0 7)摘 要:介绍了用 E x c e l 进行回归分析的 3种方法(散点图、工作表函数和回归分析工具),及其在气候 统计中 应用 的方法和回归分析结果的解释。关键词:E x c e l;回归分析;气候统计 中图分类号:P 4 0 9 文献标识码:C 1 引言 回归分析方法是一种分析变量相关关系的统计 方法,在天气预报和气候分析中应用非常广泛。传 统的回归分析方法是对线性回归模型采用最d,-乘 法来拟合回归方程,然后计算相关系数进行显著性
5、检验,而对非线性方程,还得对 自变量和因变量作适 当的变换,把非线性方程转化为线性方程,然后再用 线性回归的方法处理。这种方法求解过程非常繁 琐,计算复杂。在 E x c e l 中进行 回归分析不需要编 程,把复杂的计算过程交给计算机处理,使用起来非 常简单,本文探讨 了如何使用 E x c e l 进行气候统计 中的回归分析。2 E x c e l 中回归分析方法 E x c e l 中提供 3种回归分析的方法:散点图、工 作表函数和回归分析工具。2 1 利 用图表进行 回归分 析 如果只是描述现象 间的相差程度与变动关系,则可以利用图表进行 回归分析。这种回归分析方法 直观方便,易于理解
6、,但不能进行统计推断和预测。具体方法是:在 M i c r o s o f t E x c e l 中选取要进行 回归分析的工作表,从“插入”菜单中选择“图表”,打开图表向导,在“图表类型”中选择“X Y散点图”,然后按照图表向导往下做,就可得到 X Y散点图。2 2 利用工作表 函数进行 回归分析 收稿 日期:2 0 0 40 30 8 第一作者简介:左利芳(1 9 6 4一),女,副教授,主要从事气象 和计算机教学工作。维普资讯 http:/ 2 0 0 5年 1期 第 2 9卷 左利芳,等:E x c e l 中的回归分析在气候统计中的应用 V o L 2 9 N O 1 E x c e
7、 l 为回归分析提供了工作表函数,利用这些 函数进行 回归分析方便快捷。2 2 1 截距函数 I N T E R C E P T 其功能为利用已知 的 值与 Y值计算 回归直线在 Y轴的截距。语法结 构为:I N T E R C E PT(k n o w n _ y s,k n o w n X s)。其 中:k n o w nY s 为所观测的因变量数据或数据组,k n o w n X S 为所观测的自变量数据或数据组。2 2 2 斜率 函数 S L O P E 其功 能 为返 回根 据 k n o w nY s 和 k n o wn X s 中的数据点拟合 的线性 回 归直线 的斜 率。语
8、法结构 为 S L O P E(k n o w n Y s,k n o w nX s)。其中:k n o w n Y s 为数字型因变量数 组或单元格区域,k n o w n _ x s 为 自变量数据点集合。2 2 3 测定系数 函数 R S Q 其功能为返 回根据 k n o wnY s和 k n o w n X s中的数据点计算得 出的 P e a r s o n积矩法相关系数的平方。语法结构为 R S Q (k n o wn Y s,k n o w n X s)。其中:k n o w n Y s 为因变 量数组或数据点区域,k n o w n X s 为 自变量数组或 数据点区域。2
9、2 4 估计标准误差 函数 S T E Y X其功能为返 回 通过线性回归法计算 Y预测值 时所产生 的标 准误 差。标准误差用来根据单个变量计算出的Y预测值 的误差量。语法结构为 S T E Y X(k n o w n Y s,k n o wn X s)。其中 k n o wn Y s 为因变量数组或数据点区 域,k n o wn_ x s 为 自变量数组或数据点区域。用图 1 资料计算结果:表 1 利用工作表 函数的计算结果 2 3 利用 回归分析工具进行 回归 分析 E x c e l 除可以通过图表和工作表函数进行 回归 分析外,还提供了回归分析工具。回归分析工具既 能进行简单 回归分
10、析,又能进行多元回归分析,得出 一系列的回归分析结果,可用于复杂的统计分析;而 工作表函数一次只能输出一个结果。回归分析工具 的分析结果与输出之间不存在动态联系,而工作表 函数输入项和结果之间存在动态联系。所以,如果 不重新运行回归分析工具,以其新的结果覆盖原结 果的话,回归分析工具输出的结果是不会改变的。回归分析工具需要安装。如果在 E x c e l 的“工 具”菜单中没有找到“数据分析”选项,则说明 E x c e l 安装不完整,必须在 E x c e l 中重新安装“分析工具 库”内容。安装方法如下:在“工具”菜单 中,单击“加载宏”,选 中“分析工具 库”和“分析工具库 一 V B
11、 A函数”复选框,单击“确定”,系统将会引导用户 开始安装。安装完毕后,“数据分析”选项就会出现 在 E x c e l 的“工具”菜单中。在“工具”菜单 中选择“数据分析”,从“数据分 析”对话框的“分析工具”列表中选择“回归”,就可 利用 回归分析工具进行 回归分析。3 回归分析工具在气候统计 中的应用 3 1 一元线性 回归 图 1给出青海省 l 2个测站 1 月平均气温、海拔 高度和纬度值。根据气候学原理,在其他因子大致 相同时,气温随海拔高度线性递减。3 1 1 操作步骤将青海省 l 2个测站 1 月平均气 温和海拔高度值录入 E x c e l 工作表,如图 1。图 1 青 海 省
12、 1 2个 测 站 1月平 均气 温(T)、海拔高度(h)和纬度(中)值 在“工具”菜单中选择“数据分析”选项并打开对话 框;在“分析工具”列表中选择“回归”选项,打开“回 归”对话框;在“Y值输入区域”中输入 A 2:A 1 3,在“x值输入区域”中输入 B 2:B 1 3;选择“标志”,置信 度选择 9 5;在“输 出选项”中选择“输 出区域”,在 其右边的位置输入“D l”,单击“确定”,输 出结果如 图 2。3 I 2 回归分析结果 的解释图 2中的回归计算 结果分为 3大模块:第一模块为回归统计,M u l t i p l e R(复相关系数 R),是 R 的平方 根,又称 为相关
13、系数。R S q u a r e (复测定系数 R ),用来说 明用 自变量解释因变量变 差的程度,以测量同因变量 Y的拟合效果。A d j u s t e d R S q u are(调整复测定系数 R )仅用于多元 回归才 有意义,它用于衡量加入独立变量后模型的拟合程 3 S 维普资讯 http:/ 2 0 0 5年第 1期 第2 9 卷 贵州 气象 J o u rna l O f G u i z h o u Me t e o r o l o g y Vo L 2 9 N0 1 t L J S 1 M M,;f 0 V T P u T 豁|孳巷碴 羹 妻 塑*咀t I 砖e R 誊 蔓 窭
14、R s 口 u tY-e 0 5 3 0 2 童 蔓 滔A 4 i 粤 d R s e 13 4 8 3 3 鎏 鬻掭准瀑差 2 9 B 9 6 8 。吝;冀溉 值 2 l 甏。博 善 蚯 1 l 通 d f S S s ,si n l f i c a h c e F 巍 2 l j 回归分析 l 4 q 6 7 7 8 0 1 4 9 6 T T 8 o l l 1 2 8 2 l 0 7 2 3 O 0 0 7 2 6 轰 O 8 8 8 9 8 8 8,6 6 8 8 l 8 8 8 6 8 挝鬻 总c 十 1 l 8 T 6 8 6 6 8 6 7 魏每 搿 c 0 e f f i c
15、 i e n t 标准误差t S t a P-u e L o w e r 9 5 鼍 0 e r 9 s 嚣 下限9 5 跟 9 5 0 童 h c e p t 0 5 5 8 9 2 3 7 2 4 5 4 8 1 5 0 0 6 O 8 8 3 7 0 8 8 5 7 7 2 7 7 3 9 8 7 8 8 5 竹2 T 7 3 9 8 T 0 撼 弱海 拱畜 摩 -O 0 0 3 8 1 0 0 0 i 0 7 3 3 S 8 8 8 0 0 0 7 2 5 -8 0 0 6 0 1 -0 0 0 1 2 2 0 0 0 6 0 1-0 0 0 1 2 2 图2 一元线性回归分析计算结果
16、 度。当有新的独立变量加入后,即使这一变量同因 变量之间不相关,未经修正的 R 也要增大,修正的 R 仅用于比较含有同一因变量的各种模型。标准 误差用来衡量拟合程度的大小,此值越小,拟合程度 越好。观测值指用于估计回归方程的数据的观测值 个数。第二模块为方差分析表,主要作用是通过 F检 验来判断回归模型的回归效果,其 中“回归分析”行 计算的是估计值 0同均值 Y之差,即(;一),)的各项 指标;“残差”行用于计算每个样本观察值 Y与估计 值 0 之差的各项指标;“总计”行用于计算每个 Y值 同均值 Y 之差的各项指标。第 2列 d f 是 自由度,第 3列 s s 是离差的平方和,第 4列
17、MS 是均方差,第 5 列是 F统计量,第 6列(S i g n i fi c a n c e F)是在显著水 平 F。临界值。第三模块为回归参数值,位于图 2中的下部分,用于回归方程的描述和回归参数的推断。表中第 2 行和第 3 行分别是截距和斜率;第 2列给出了回归 系数 3。和 3 的值,据 此可 写 出 回归方 程,=一0 5 5 8 9 2 0 0 0 3 6 1 h;第 3列是回归系数的标准误 3 6 差;第4列给出用于原假设:3。:3 =0的样本统 计 t 的值;第 5列给出各个 回归系数的 P值(双侧),最后给出 9 5 的置信区间的上下限。另外,如果表 中的 P值小 于 0
18、0 5,表 明回归系数都显著不为零,说明回归方程显著。3 2 多元线性回归 虽然 目前 已有许多多元分析专用软件,但 E x c e l 的回归分析工具仍有广泛的应用前景。如图 1,青海 1月平均气温不但 与海拔高度有 关,还与纬度有关,可建立一个二元 回归方程。3 2 1 操作步骤 打开 图 1所在工作表,在“工 具”菜单中选择“数据分析”选项;打开“数据分析”对话框,在“分析工具”列表中选择“回归”选项;打 开“回归”对话框,在“Y值输入 区域”中输 入 A 2:A 1 3,在“x值输入区域”中输入 B 2:C 1 3,这里包括 海拔和纬度两个 自变量,回归工具要求 自变量之间 必须相邻,
19、不 能 隔开;选 择“标 志”,置 信度 选 择 9 5 ;在“输出选项”中选择“输 出区域”,在其下边 的位置输入“A 2 2”,单击“确定”,输出结果如图3。S 嗍 R Y o t ff t ff I 1 l 2 4 回归 亮 计 L 嚣-u l t i D l e R o 9 4 3,2 1 2 5 7 l 1 l 2 6 R S q 0 8 8 螺 5 oi 4 3 l,嚣,A d i u s t e d R S q,J 0 5 1 2 7 9 5 3 2 8 锰准误差 l l 1 S 1 5 9 8 5 1 g 6 l 2 窜 窥 测值 1 2 3 0 1 1 ;3 l 方算*析 1
20、 d f S S S F 1 0 l f c e F l 箝 回蜉分折 2 l 龋 9 7 8 4 6 9 9 8 3 4 8 7 7 3 9 5 3 6盯9 3 9 i 4 9 2 5 7 8 E 一 0 5 ;3 聩差 9 2 0 7 1 1 1 9 6 7 7 2 1 3 0 1 2 4 0 8 5 l 3 5 总计 1 1 1 8 7 6 8 6 6 fi 7 3 6 l 钎 c f i i 啦t i 程 难瀑姜 t s t t t P v d L a q s t U e r 钙 下蹲 9 5 o 1 跟 9 5 3 8 I n t e r c e m t 两 4 3 4 2 1 3
21、5 2 1 0 6 9 5 5 4 S 2 7 8 4 2 5 1 9 0 0 0 0 5 0 9 5 1,3 3 2 2 5 9 1 9 1 8 2 8 0 6 2 9 2 3 5 8 3 2 2 3 9 1 9 l 8 2 8 0 8 2 鸵3 5 4 2 海拔高 度 c 米)0 9 S l 舭1 O:。6 2 8 8 吨 蔫 I 2 7 3 1 6 2 1 5 5 7,7 5 E。0 5 -0 0 0 6 6 0 7 7 9 4 _-8,0 0 3 7 9 1 9 口 -0 0 0 6 6 0 7 7 9 4 -8 0 0 3 9 1 O 0 9 蚰 韩席 一 1 4 4 o e 9 6
22、 7 7 0 2 6 5 0 5 4 1 0 7 -S 4 1 c 4 3 4 3 9 3 8 O 0 0 0 4 2 5 7 7 -2 0 4 2 5 5 1 3 3 9 0 8 3 8 1 6 -2 O 4 2 5 5 1 3 3 9 8 8 3 8 8 3 8 0 1 6 H;M 一5 h e e t l S h t 2 e t 3 i l l l_删“露 墨 就暗;聃 图 3 多元 回归分析输 出结果 维普资讯 http:/ 2 0 0 5年 1 期 第 2 9卷 左利芳,等:E x c e l 中的回归分析在气候统计中的应用 V o L 2 9 N O 1 3 2 2 回归输出结果解
23、释回归统计表中,调整复 测定系数位于 B 2 7单元格中,其数值为 8 6 5 1 ,这 说明海 拔 和纬度两 个 自变量 能解 释气 温变 化 的 8 6 5 1,大约气温变化的 1 3 要 由其他因子来解 释;估计的标准误差位于 B 2 8单元格 中,其数值 为 1 5 1 7 0,说明实际值与估计值之间的误差。方差分析表 中,F 3 3单元格 中的 F统计量 的 P 值(F 3 8)约等于 0 0 0 0 0 5,远小于显著水平 0 0 5,说 明方程回归效果显著。回归参数表中,截距 0 用“I n t e r c e p t”表示,其数 值为 5 6 4 3 4 2;回归系数 用“海拔
24、高度”表示,其 数值为 一 0 0 0 5 2;回归系数 用“纬度”表示,其数 值为 一1 4 4 0 7。回归方程可以写为:=5 6 4 3 4 2 0 0 0 5 2 h一1 4 4 0 7 中 3 3 非线性回归 在实际工作中,常常遇到因变量的条件数学期 望不是 自变量的线性函数 的情况。例如,近地层数 1 0 m以内风速随高度的变化是对数 曲线关系,山坡 上降水量随海拔高度 的变化是抛物线关系,等等。研究这些变量之间的关系,就属于非线性回归问题。非线性回归问题可以通过线性变换来使其线性化,从而利用回归分析工具进行分析。本文以风速随高 度变化的对数模型说明在 E x c e l 中进行非
25、线性 回归 分析。3 3 1 操作步骤在 E x c e l 工作表 中输入 7个高 度的风速观测值,制作风速与高度 的散点 图(如图 4),可见其分布近似对数曲线,于是选择 回归曲线。Y 0+b l n x 图4风速与高度散点图 在 E x c e l 中将 l n x当作 自变量处理,也就是说,对数曲线回归的基本方法是先对原数列取对数,生 成一个新序列,回归分析工具将它看作一个 自变量 来拟合 曲线。因此,在 A列和 B列 中间插入一列,在单元格 B 1中输入“l n(高度)”,在单元格 B 2中输 入公式“:l n(A 2)”,以计算 A 2的对数,并复制到 B 3:B 8区域的各个单元
26、格 中,然后在“工具”菜单 中 选择“数据分析”选项,打开“数据分析”对话框;在“分析工具”列表中选择“回归”选 项,单击“确定”按钮,打开“回归”对话框;在“Y值输入区域”中输 入 C 2:C 8,在“x值输入 区域”中输入 B 2:B 8:选择“标志”,置信度选 择 9 5;在“输 出选项”中选择“输出区域”,在其右边的位置输入“D 1”,单击“确 定”,输出结果如图 6。l uI t pl c R 0 2 4 6 2 4 R s O 5 s d j t e d R 0,9 q 一 哥惠最差 n 8 2 T,骰 1 1 4 5 4:“一 “”j 6 f t 标 、t s t i I T 甲
27、 r ;:墨:g 1 4 7 9 30 9:I 4 0 5 9。,嚣:嚣 I 4 7 5;:嚣 H、和 t q 越 啦 臣,J j r 图 6对数 回归 分 析结 果 3 3 2 回归分析结果解释R S q u a r e 约为0 9 9 6 7,说明风速 的 9 9 6 7 可用 高度 的对数 解 释,只有 0 3 3 要 用 其 他 因 子 来 解 释;F统 计 量 约 为 1 4 8 8 4 5 4,根据 F统计量得到的 P值很小,远远小 于显著水平 0 0 5,说明回归方程有效;回归系数分 别在单元格 E l 7和 E l 8中,其相应的 t 检验值及 P 值表明回归系数显著不为零,能
28、解释风速的变化。据此可写出方程:=1 0 2 6 6+0 8 1 4 8 1 n x 如果要考虑多个 自变量与因变量 的非线性关 系,作为一种简化或近似,可以分别对各个 自变量建 立一元非线性回归方程,将这些一元非线性 回归方 程作为各自变量的经验变换 函数,对 自变量作经验 变换,然后建立因变量依变换后的 自变量的多元线 性 回归方程。4 结语 用 E x c e l 中的回归分析工具进行气候统计中的 回归分析,快速准确,不需要编程,非常方便。参考文献 1 于洪彦 E x c e l 统计分析与决策 M 北京:高等教育出 版社 2 0 0 1 1 6 61 9 0 3 7 维普资讯 http:/