《MATLAB回归分析在测绘数据处理中应用.pdf》由会员分享,可在线阅读,更多相关《MATLAB回归分析在测绘数据处理中应用.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、文章编号:1671-9662(2009)03-0039-04MATLAB 回归分析在测绘数据处理中应用*高彩云,高?宁(河南城建学院测绘与城市空间信息系,河南 平顶山 467044)摘?要:?介绍了科学与工程计算软件 MATLAB,并将其应用到测绘数据处理中,给出了MATLAB 一元线性回归的分析计算程序及使用方法,得出用MATLAB 软件建立一元回归模型的优越性。关键词:?MATLAB;回归模型;测绘数据处理中图分类号:?P209?文献标识码:A0?引言?在测绘数据处理中,为了把握某些规律经常需要研究和探寻一些变量之间的关系。变量之间的关系一般可以分为两类:一类是变量之间具有确定性关系,这些
2、关系是可以利用数学或物理公式表示出来,即函数关系;另一类变量之间并不存在确定的函数关系,例如水库大坝的水平位移与气温这两个量的相关关系,再如视距仪乘常数的大小与观测气温之间,重力测量结果与气压、温度、地下水等因素之间,它们是密切相关的,但是不能用一个或者是几个变量的数值精确求出另外一个变量的数值,需要通过调查研究和实验才能确定,这种关系称之为相关关系 1、2。?回归分析就是利用数理统计的方法,找出这种变量之间相关关系的数学表达式。利用这些数学表达式以及对这些表达式的精度估计,可以对未知变量作出预测或监测其变化,对于这些非确定性关系回归模型的建立就需要编写相应的程序,通过计算机来解决。许多测绘工
3、作者尝试用Basic、Fortran 以及 C 语言编制程序,这对于不是专门从事程序开发的测绘人员来说具有一定的难度,而且用它们编制的程序上机调试也是一项非常繁杂的工作。MATLAB 在大规模数据处理特别是矩阵运算方面具有其他程序设计语言难以比拟的优越性。本文以 MATLAB 建立回归模型,将其应用到测绘数据处理中。1?MATLAB简介?MATLAB是美国 MathWorks 公司自 20 世纪 80 年代中期推出的数学软件,其优秀的数值计算能力和卓越的数据可视化能力使其很快在数学软件中脱颖而出,成为从事线性代数、自动控制理论、概率论和数理统计、数字信号处理、时间序列分析、动态系统仿真等领域教
4、学和科研工作者的有力武器。?MATLAB 提供了一个人机交互的数学系统环境,该系统的基本数据结构是矩阵。在生成矩阵对象时,不要求明确的矩阵维数说明。与利用 C 语言或 FORTRAN 语言做数值计算的程序设计相比,利用 MATLAB 可以节省大量的编程时间。因此,MATLAB 常被用来解决一些实际课题和数学模型问题,其典型的应用有:数值计算、算法预设计与验证以及一些特殊的矩阵计算,如自动控制理论、数理统计、数字信号处理(时间序列分析)等。MATLAB 系统由 MAT?LAB 语言体系、MATLAB工作环境、MATLAB 图形处理、数学函数库、MATLAB 应用程序接口(API)五个主要部 分组
5、成 3 9。?MATLAB是一个集数值计算、图形管理、程序开发于一体的功能十分强大的系统,将 MATLAB 应用于测量数据处理具有一定的实际意义。2?回归模型的建立?回归分析式是研究变量之间相关关系的一种统计推断法,是应用数学的方法对大量的观测数据进行处理,从而得出比较符合事物内部规律的数学表达式。回归分析包括(一元和多元)线性回归、一元非线性回归和多项式回归等。下面以一元线性回归为例,说明回归分析的理论组成,利用回归分析处理问题的步骤如下1 3:?建立回归数学模型?通过对一个问题进行试验后,可以得到很多组数据对,可以将这些数据对展现在坐标纸上,然后根据所得的散点图来确定所要用的数学模型。在这
6、里一元线性回归的数学模型为 1、2:?yi=a+bxi+?i?(i=1,2,3 n)?式中,?i为随机误差,一般假设它们相互独立,且服从同一正态分布N(0,?)。对一元线性回归模型主要讨论如下*矿山空间信息技术国家测绘局重点实验室基金项目(KLM200818);河南省教育厅 2009 年自然科学研究指导计划项目(2009B170001);河南城建学院 2008 年院级基金资助项目。收稿日期:2009-03-04第一作者简介:高彩云(1980-),女,河北石家庄人,硕士,河南城建学院助教。第 18 卷第 3期2009年 5 月?河 南 城 建 学 院 学 报Henan University of
7、 Urban Construction?Vol.18 No.3May.2009三个问题:!对参数 a、b 和?2进行点估计,估计量?、b称为样本回归系数或经验回归系数,而y=a+bx 称为经验回归直线,其图形相应地称为经验回归直线;在回归模型下检验 y 与x 之间是否线性相关;#利用求得的经验回归直线,通过 x 对y 进行预测或控制。?参数 a、b 的最小估计及经验公式?将 n 组实验数据(xi,yi)代入?式,设 Vi为-?i的估值,则?式可表示为?Vi=?+bxi-yi按最小二乘准则?%ni=1v2i=MIN解得:?b=LxyLxx&?b=?y-b-?x?式&所示的a、b分别称为参数a、b
8、的最小二乘估计,式中:?Lxx=%ni=1(xi-?x)2=%ni=1x2i-1n(%ni=1xi)2?Lxy=%ni=1(xi-?x)(yi-?y)=%ni=1xiyi-1n(%ni=1(xi)(%ni=1yi)(?&相关性检验?求回归直线的前提是变量 y 与 x 必须存在线性相关,否则所拟直线毫无实际意义。因此,必须有一个数量性指标来描述这两个变量线性的统计相关程度,相关性系数定义为:?=?xy?x?y)?其估值为:=%ni=1(xi-?x)(yi-?y)%ni=1(xi-?x)2%ni=1(yi-?y)2?当 越接近+1 时,表明随机变量 y 与x 相关性密切,即所建立的线性模型和实际的
9、试验情况越接近。?(回归预测?对一个问题进行回归分析的目的主要是进行预测和控制。在实际应用中,若响应变量 y 比较难观测,而控制变量x 却较容易观察或测量,那么根据观测资料得到经验公式后,只要观测 x 就能求得 y 的估计和预测值,这是回归分析最重要的应用之一。3?回归模型的MATLAB 计算?根据所得试验数据 y 与 x,利用下面的函数可以绘制试验散点图、求出回归线并在一个图像窗口绘制散点图和回归线图,还可以计算相关系数 和最小二乘回归的估计误差,根据所得回归线进行预测。?绘制试验数据散点图?function sdt(x,y)?%绘制散点图?x=x(:);y=y(:);?%试验所得向量?fi
10、gure?plot(x,y,*b,)?%以 X 为横轴,Y 为纵轴,以蓝色绘制散点图?title(,散点图,)?回归方程计算函数,并在同一窗口中绘制散点图和回归线图?function jshgfc(x,y)?x=x(:);y=y(:);?n=length(x)%计算向量 X 的长度?A=ones(n,1),x?ab=A y;%矩阵左除求系数阵?a=ab(1);b=ab(2);?S=,回归方程是 y=,num2str(a),+,num2str(b),x,;?disp(S)?X=min(x),max(x);?Y=a+b.*X?figure?plot(x,y,*b,X,Y,b,)%绘制散点图和回归线
11、图?title(,散点图与回归线图,)?&拟合测定函数,求相关系数?function?jynh(x,y)?%拟合程度测定?x=x(:);y=y(:);%试验所得向量?A=x-mean(x);%计算向量 X 与均值之差?B=y-mean(y);%计算向量Y 与均值之差?pxy=sum(A.*B);?pxpy=(sum(A.*A).*sum(B.*B)0.5;?p=pxy/pxpy%计算相关系数?(计算中误差函数?function jszwc(x,y)%计算中误差?x=x(:);y=y(:);?n=length(x)%计算向量 X 的长度?A=ones(n,1),x?ab=A y;%矩阵左除求系数
12、阵?a=ab(1);b=ab(2);?S=,回归方程是 y=,num2str(a),+,num2str(b),x,;?disp(S)?X=x;?Y=y;?Y1=a+b.*X;?vv=sum(Y1-Y).*(Y1-Y);?s=(vv)/8)0.5%中误差40?河南城建学院学报?2009 年 5月?MATLAB 计算步骤:第一步,先将?散点图绘制函数程序;一元线性回归方程计算函数,并在同一个窗口中绘制散点图和回归线图程序;&拟合测定函数,求相关性系数 程序分别粘贴到M 文件中,并保存(名称分别默认为 sdt.m、jshgfc.m、jynh.m、jszwc.m)。第二步,在 MATLAB 命令窗口中
13、输入 x,y 值回车运行;第三步,在MATLAB 命令窗口中输入命令函数 sdt(x,y)回车运行,即得散点图;输入命令函数 jshgfc(x,y)回车,即得回归方程与回归曲线;输入命令函数 jynh(x,y)回车,即得相关系数;最后输入 jszwc(x,y),得到回归中误差。4?实例分析?为了验证MATLAB 回归分析的合理性与正确性,应用文献 2 295 页例 2 的数据。在本示例中,为了考察视距仪的乘常数 C在测量时温度变化的影响,选择 10 段不同距离进行了试验。测量所得的 10组平均 C 值和平均气温 T 见表 1。表 1?乘常数 C与平均气温 T 表组号TC111.9196.842
14、11.5196.84314.5197.14415.2197.03515.9197.05616.3197.13714.6197.04812.9196.96915.8196.951014.1196.98?验证步骤如下:?第一步:利用绘制散点图函数(function sdt(x,y)绘制的乘常数 C与平均气温散点图如图 1所示。图 1?MATLAB绘制的散点图?第二步:一元线性回归方程计算(function jshgfc(x,y)?利用MATLAB求得回归方程为 y=196.31+0.048x(x对应温度T,y 对应乘常数 C),与文献2 计算结果一致。?第三步:相关系数检验(function jy
15、nh(x,y)?经计算得到相关系数=0.777,文献2 计算结果为=0.78,可见两者计算结果一致。?以自由度!=n-2=8,在显著水平=0.05查相关系数表得 0.05=0.63,?现 0.05,y 与x 相关显著,直线回归有效。?第四步:回归中误差与回归预测?利用函数 function jszwc(x,y)计算回归中误差为 s=0.069,经上述计算证明回归方程有效。此后就可按式 y=196.31+0.048x 根据给定温度值T 来预测乘常数 C,从而保证视距仪测距的精度。其回归方程与残差如图 2所示。图 2?回归方程与残差5?结论?由 MATLAB计算过程可知,采用 MATLAB 对测量
16、数据进行处理简便、快捷和直观。其中,根据最小二乘原理拟合出的图形可供试验报告中使用或在手工计算时查找。得出的多项式可供理论分析与预测。该方法同样适合于其它行业中图表曲线的处理,而且能满足工程的精度要求。?对一元回归模型的建立,如果用纯数学方法通过计算器人工计算将非常繁杂。本文以 10组观测数据为例,就说明了这一点,如果有上百个乃至几千个如果还用纯数学方法显然是不可取的,这需要编制相应的程序来解决。利用 MATLAB语言来建立一元回归模型省去了编写程序与上机调试的麻烦,如果采用 FORTRAN 或 C 语言来建立模型则几十条语句多则上百条语句,因此,由MATLAB 语言建立一元回归模型有着其它语
17、言不可比拟的优越性。参考文献1刘大杰,陶本藻.实用测量数据处理方法 M.北京:测绘出版社,2000.2陶本藻.概率统计原理在测量中的应用M.北京:测绘出版社,1990.3王乐洋,朱建军.回归分析、测量平差与大地测量反演 J.测绘通报,2007(2):27-30.4高?宁,高彩云.MATLAB 在测绘领域中的应用J.平顶山工学院学报,2008(1):28-31.5张智星.MATLAB程序设计与应用M.北京:清华大学出版社,1993.第 18 卷第 3 期?高彩云等:MATLAB回归分析在测绘数据处理中应用?41 6 崔?利,武文波.测绘领域中 MATLAB 的应用 J.辽宁工程技术大学学报,20
18、05(4):47-49.7 鲁铁定,周世健,张立亭等.测量平差教学中MATLAB 软件的应用J.地矿测绘,2004(1):43-45.8曾文华.MATLAB 在地理信息系统中的应用 J.计算机应用,2002(5):91-94.9清源计算机工作室.MATLAB 6.0 基础及应用M.北京:机械工业出版社,2001Application of MATLAB regressionanalysis in surveying and mappingGAO Cai?yun,GAO Ning(Department o f Survey&U rban Space Information Engineering
19、Henan University o f Urban Construction,Pingdingshan 467044,China)Abstract:MATLAB and its application are introduced in surveying and mapping of data processing,and as well as a linear regressionanalytical computational procedures.It,s superiority of using the software to establish a linear regressi
20、on model is demonstrated.Key words:MATLAB;regression model;surveying data processing(上接第 38 页)?由表 3可知,若保持 1998 年-2004年的变化速度,到 2010 年,耕地面积变化不大;但是塌陷地增长迅速;林地和建筑用地减少较快,水域变化不大。把 2010 年的预测值和 1986 年的初始值相比较,该矿区耕地面积变化不大,说明该区域在保持耕地总量动态平衡方面作的较好;塌陷地从无到有,并且增长速度很大,如何治理塌陷地是该矿区下一步土地复垦工作的重点。林地面积的减少,对保持该区域的生态平衡提出了严峻的
21、挑战。4?结论?矿区资源的开采,破坏了大量土地特别是耕地,这对矿区能否保持耕地总量动态平衡和 占补平衡.是一个严峻的考验。如何预测矿区土地演变,根据预测的结论提前制定复垦就显得尤为重要。通过马尔科夫模型可以较好地预测矿区土地演变情况,为制定复垦计划提供有利帮助。参考文献 1 刘?岩,刘?芳.马尔科夫链在人民币汇率预测中的应用J.中国管理信息化,2007(3):68-70.2 徐建华.现代地理学中的数学方法M.北京:高等教育出版社,2004.3 陈龙乾.矿区土地演变监测与可持续利用研究M.徐州:中国矿业大学出版社,2003.Study on dynamic changes of miningar
22、ea land use base on Markov modelZHANG Hou?tian1,ZHANG Hong2(1.Department o f Civil Engineering,Luoyang Institute o f Science andTechnology,Luoyang 471023,China;2.Henan Quality Polytechnic,Pingdingshan 467000,China)Abstract:Land,particularly,the mine land,is generally one of the key issues of concern
23、 based onthe famous Markov Chain of randomprocess,take reciprocal transformation of mining land-use types as the operator to establish land evolving model in mining area.Analy?sis of the land evolving trend in mining area is performed based on the model,which can provide help for land restoration.Key words:land;Markov;random process42?河南城建学院学报?2009 年 5月