《非线性理论与方法(共189页).doc》由会员分享,可在线阅读,更多相关《非线性理论与方法(共189页).doc(189页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上工程中的非线性理论与方法Ref:1. 冯康等编,数值计算方法,国防版。2. 何君毅,工程结构非线性问题的数值解法,国防工业版。3. 王德人编,非线性方程组解法与最优化方法,高教版 4. 李岳生编,数值逼近,人民教育出版社。绪 论一 非线性问题的广泛性工程中的非线性问题是普遍存在的。严格地讲,工程中几乎绝大多数复杂问题都具有非线性本质或呈现出非线性现象,仅是在一定的条件之下,我们可将其理想化或简化为线性问题。因此,曾有学者认为:在物质世界中,无论是宇观、宏观和微观,都是由一定层次结构和功能的非线性系统构成的,也即自然界和现实生活中几乎所有系统都是非线性的。事实上,正是由
2、于非线性的存在和作用,才孕育出大自然的五彩缤纷、万千气象和人类社会的风云变幻,人类思维的错综差异。1. 数学中的非线性问题:1).代数插值2).曲线曲面拟合3).非线性回归4).高次代数方程和超越方程5).非线性方程组6).非线性常微分方程(组)7).非线性偏微分方程(初值、边值)8).非线性规划(无约束、约束)。2.机械与结构工程中的非线性问题:1).柔性可变结构的计算(柔索计算)2).材料非线性问题(弹塑性力学,塑性力学,蠕变力学)3).复合材料力学4).几何非线性问题(大变形问题,屈曲问题)5).边界(接触)非线性6).非线性动力学(定则振动,随机振动)柔性多体系统动力学7).非线性系统
3、控制问题8).传热学中的非线性问题9).流体力学和空气动力学中非线性问题等等二 非线性问题(系统)的特点 尽管工程中的非线性问题涉及到许多学科,内容不尽相同。但它们都具有如下非线性问题的共同特点:1. 系统最终的控制方程均为非线性方程(代数、常微分、偏微分)2. 线性迭加原理在整体上不成立,最多只在只局部近似成立例如:基于线性迭加原理的力法方程,杜哈美积分(卷积),振型迭加法等等,在整体上均不成立。对于非线性问题应用线性问题中的这些求解方法将导致不真实甚至不合理的结果。3. 问题一般无解析解(除一元二次方程外)即适用于线性问题的解析法对于非线性问题无能为力,故通常均需采用数值方法或其它近似方法
4、求解。4. 非线性问题的理论和方法仅在一定范围内适用对于非线性系统一般都具有开放性、对称破缺、不可逆性、遍历性和不确定性。由于非线性问题的上述特征,使得对于非线性问题,人们不能再指望并且也不会存在有像牛顿力学那样具有普遍性和完备性的理论,非线性问题中几乎所有的理论和方法都不能也不可能包打天下,都将具有一定的适用范围,即使像数学公理体系也都是不完备的。三. 非线性问题研究的历史与现状历史:工程中的非线性问题早在19世纪中叶就引起人们的关注,并引起了一些著名数学家,力学家的研究兴趣,经过他们的不懈努力,取得一些了不起的研究成果,例如,19世纪以俄国学者庞加箂为代表的学派,针对求解非线性振动方程提出
5、了摄动方法、等效线性化方法、相平面方法等等,至今仍为求解拟非线性微分方程的基本方法之一。又例如:针对于求解场问题(电磁场、温度场、流场、应力场)产生于20世纪早期的有限差分法和变分法等等,至今仍在发挥着重要的作用。然而,由于当时科技水平的限制和计算工具的匮乏与落后,非线性问题的解决尚没有革命性和根本性的突破。许多非线性问题仍被人们视若“难题”,“硬骨头”和“拦路虎”,使人望而生畏、束手无策,。鉴于此,工程师在分析、计算和设计中不得不回避或绕道而行。,可以说,在相当长的历史阶段,科学家和工程师面对非线性科学向人们提出的巨大挑战,在不懈的努力,焦急的徘徊。现状:经过几代科学家多年的努力,特别是自2
6、0世纪60年代以来,有限差分,有限元和边界元法等数值方法的出现和发展,以及高速大容量的电子计算机的问世和普及应用,为非线性问题的解决提供了必要的计算手段和计算工具,使人们对非线性问题的研究如虎添翼,研究工作取得了长足的进步。今天不仅已可对许多非线性问题进行定性分析,而且定量的数值分析和模拟亦成为可能。近年来,科学家们对非线性问题的研究掀起了一个空前的高潮。非线性问题成为各学科中的热点课题,研究论文与日俱增,学术研讨会也越来越多。可以断言,随着非线性“普适性”和新的数学分析方法的诞生,使得许多人们长期认为是非常困难的非线性问题的求解不再是“天方夜谭”。如:流体力学中的湍流问题,分岔和分形问题,混
7、沌问题,神经网络系统问题等等。充分显示出非线性科学的巨大潜力和重要意义。尽管在近十多余中,非线性科学的研究有了空前迅速的发展,但目前对非线性问题仍然缺乏系统的处理方法和分析框架,对于一般非线性发展方程还没有线性问题中Fourier交换那样类似的工具。完全地攻克非线性这一科学道路上的超级堡垒,是整个科学界进入21世纪将面临的一项巨大挑战,也是未来整个自然科学和工程领域研究的前沿工作。四 本课程学习主要内容Ch1.代数插值Ch2.曲线曲面拟合Ch3.非线性方程的数值解法Ch4.非线性方程组的数值解法Ch5.非线性规划问题Ch6.非线性振动Chapter1 代数插值1.1 概述1. 问题的背景:(1
8、).工程上:在机械制造、几何造型中,常常给定一批离散样点,要求利用数学的方法,自动作出一条光滑的曲线(甚至曲面),使这一曲线(面),通过这些样点,以满足设计要求或据此进行放样机械加工。例如:赋形抛物线,汽车、飞机的曲面外壳等等。(2).数学上:在用数值方法求解有关连续函数问题时,往往要根据已知离散点的数据插补中间点。如:用差商代替微商;有限元中求非节点处的位移和应力等等。与此相关的一类数学问题即是插值问题。2. 问题的提法通俗的讲,所谓插值就是在给定的样点间再插进一些所需要的中间值。如何进行插值,其基本思想是:设法构造某个简单函数y=F(x),作为样点函数的近似。其数学提法是:给定一组样点:
9、,确定一个光滑的连续的函数y=F(x),使其曲线通过所有的样点,即满足: (*)如图示满足上述要求的函数y=F(x)称为插值函数,它是待求的函数。构造F(x)的基本要求:(1)函数形式为便于计算的“初等”函数,如:多项式函数、分段多项式函数;(2)函数的自由度(即待定参数个数,例如多项式的系数)数目应与要求的插值条件(*)个数相等。1.2多项式插值为以下讨论方便,统一约定如下:(i=0,1,2)节点f(x)某个原函数,其在节点处的函数值为:一阶导数值为:;F(x)待求的插值多项式函数,其次数等于插值条件数;E(x)=f(x)-F(x)为原函数与插值函数的插值余项(绝对误差)x0,x1,.=ma
10、xx0,x1,.-minx0,x1,.,表示含有点x0, x1,.的最大区间,即以上端点maxx0,x1,.和下端点minx0,x1,.构成的区间。一 线性插值(两点一次插值)求过两个样点(x0,f0),(x1,f1)的线性插值函数y=F(x)。由相似三角形关系,插值函数F在x0, x1任一点x处的函数值为: 点斜式 经整理得: (1.1b)对称式(1.1a)和(1.1b)即为所求得一次多项插值函数,共有两项。可见线性插值函数有两种表达形式,它们表述的是同一线性函数,在理论分析时常采用对称式,但在实际计算中则常用点斜式。为分析表达统一方便起见:令: (1.2)这是两个一次多项式函数。显然有:
11、(1.3)即称,为线性插值的基函数。 从而(1.1b)式给出的线性插值函数可由基函数表为: (1.1c)此式表明:插值函数为基函数的线性组合。插值公式的特点:观察点斜式(1-1a),其中的差商项:当时,若,则有;从而(1-1a)的极限形式为:此结果表明:一次插值函数F(x)的极限形式恰为原函数f(x)在节点x0处的一阶泰勒展开式,其几何上的解释为:当节点x1趋向x0时,插值函数F(x)将逼近原函数f(x)在点(x0,f0)处的切线。由微分中值定理,线性插值函数的余项(与原函数f(x)的绝对误差)为: (1.4)记x的二次多项式。则: 可见线性插值函数F(x)对于原函数数值具有二阶精度,直到一阶
12、导数值亦有逼近性。也就是说,若原函数f(x)为线性函数,则插值余项,即插值F(x)就是原函数f(x)。二. 抛物线插值(三点二次插值)线性插值仅仅利用两个样点的信息,精度自然不高。为改善精度,可采用三点两次插值。即求过三个样点(x0,f0),(x1,f1),(x2,f2)的抛物线二次函数F(x)(即二次多项式函数),见图。为二次多项式函数,其根据前的讨论,它可表为基函数的线性组合形式,即,故设: (1.5)式中为二次插值的基函数(待求),由基函数应满足的条件为: (正交规范条件) (1.6)这样的基函数不难直接构造,现以为例说明之。 欲使满足,显然中应含有和两个因子,故令: (1.7)其中:为
13、待求系数。 由条件,可解得:代入(1-7)中,可得基函数 (1.8a)这是一个两次的多项函数。类似可求得: (1.8b) (1.8c)的图形:将(1.8ac)代入(1.5)中,即可得所求得二次插值多项式函数y=F(x)。显然此函数满足所有插值条件:由微分中值定理,二次插值函数的余项(与原函数f(x)的绝对误差)为: (1.9)记x的三次多项式。则: 即二次插值多项式函数F(x)具有三阶精度,且直到二阶导数都有逼近性,即若f(x)为二次函数,则三点二次插值函数的插值余项为零。例1, 利用100,121,144的平方根求(=10.7238*)解: 样点为:x0=100,f0=10 x1=121,f
14、1=11 x2=144,f2=12 插值点:x=115,求插值函数值F(115)代入插值公式(1.5)中,即有可见:因原函数为二次函数,故二次插值函数F(x)与原函数的误差为零(具有4位有效数字的精度)。以上两种插值都是仅以节点的函数值f0,f1.为依据构造插值函数的,即所求得的插值函数F(x)与原函数f(x)仅在样点处函数值彼此相等,而导数值可以不同。这种插值即为拉格朗日(lagrange)插值问题。若使:F(xi)=f(xi) (i=0,1,2)则称F(x)为拉格朗日插值函数。在很多情况下,不仅要求插值函数F(x)在节点处与原函数f(x)函数值相等,甚至还要求F(x)与f(x)的在节点处的
15、一阶导数值彼此相等,这就是所谓埃尔米特(Hermite)插值问题,即:若使:F(xi)=f(xi),且: (i=0,1,2)则称F(x)为埃尔米特(Hermite)插值函数。显然埃尔米特插值函数,除了“过点”外还要求“相切”,从而插值函数与原函数的密合贴近程度将会更好。下面,首先介绍埃尔米特插值中两种最简单情况:即一点一次带导数插值和两点三次带导数插值。三 一点一次带导数插值(切线插值) 给定一样点为: 其中求:一次插值函数y=F(x),使,(见图)。根据以上两个条件,由解析几何很容易构造满足上述条件的插值函数为: (1-10)显然有:(过点),(相切)故(1-10)即为所求得切线插值函数。该
16、插值函数与原函数的余项为: (1-11)即一点一次带导数插值函数具有一阶导数的逼近性。四 两点三次带导数插值给定两样点:求“既过点”又“相切的”插值函数F(x)。设F(x)为三次多项式函数,即: (1-12)满足两样点及其一阶导数,即:分别将以上四个条件依次代入(1-12)中,即得四个以待定系数a0,a1,a2,a3为未知的线性方程组:从中可解出a0,a1,a2,a3,代入插值函数表达式(1-12)中,经整理最终表达式为: (1-12)其中:即为基函数。它们的表达式为: (1-13)其中:即为两点线性插值的基函数;易验证: 这是一组四维空间上的正交规范基,从而所求插值函数F(x)(1-12a)
17、满足要求的插值条件。对于基函数(1-13)式的另一种表示若令: (二次多项式) (1-14)则有: (1-15)从而基函数可表为: (i=0,1) (1-13a)此种形式便于推广到高次埃尔米特插值函数的基函数的表示之中,而形式(1-13)则便于推广到分段的埃尔米特的插值之中。两点三次带导数的插值余项为: (1-16)可见,该插值具有直到三阶导数的逼近性。1.3 一般n次多项式插值前面讨论的拉氏插值和埃氏插值的方法均可推广到更多点插值的一般情况。1 拉氏插值 求过n+1个样点(xi,fi)(i=0,1,2,n)的n次多项式插值函数。设: (1-17) 由前讨论知,该n次多项式函数共用(n+1)项
18、,它总可由其n+1个基函数的线性组合形式表出,即有: (1-18)其中n+1个基函数应满足的条件为:,为克罗内克尔(kronecker)符号。由此条件可推得拉氏插值函数的基函数的统一形式表达式为: (1-19)容易验证: 将(1-19)代入(1-18),可得所求的拉氏插值公式为: (1-18a)由(1-18a)可见:拉氏插值公式在逻辑结构上表现为二重循环,其中内循环由累积获得基函数,而外循环由节点的函数值与基函数之积累加获得插值点处的函数值。利用微积分中的洛尔定理可证明:n次拉氏插值的余项为: (1-22)其中 (1-20)可见,该插值函数具有n+1阶精度。基函数的另一种表示 基函数除以(1-
19、19)表达式外,亦可由另一形式表出:因: (1-21)从而基函数(1-19)式亦可以用和表为: (1-19a)插值多项式的次数称作插值的阶,点x称为插值点。若,则称插值为内插若,则称插值为外推。例2 已知原函数的四个样点值为:X0X1X2X3xi0.10.150.250.3Fi=f(xi)0.0.0.0.求插值点x=0.2处的f(x)的近似值。精确值为:f(0.2)=e-0.2=0.由于给定四个样点,故选用四点三次拉氏插值公式,即在n次拉氏多项式插值函数的表达式(1-17)中取三次多项式即可,该插值函数为: (a)其中由基函数表达式(1-19),该基函数为: (b)将x0,x1,x2,x3及x
20、=0.2分别代入(b)中,得基函数在x=0.2点处的值为:由(a)式,x=0.2处的函数插值为:插值余项分析,由余项公式(1-22),本例的插值余项为:从而在插值点处的余项为:由于为单减函数,故,从而有E(0.2)的区间为:此估计结果表明:插值误差最高不超过0.95*10-5,最近不低于0.77*10-6。即四点三次拉氏插值精度相当高。2 埃氏插值 设给定:n+1个节点xi(i=0,1,2.n)的函数值fi(i=0,1,2.n)和一阶导数值fi(i=0,1,2,.n),确定一个(2n+1)次的多项式F(x),使之满足以下2(n+1)个插值条件: (-23)仿照前两点三次带导数埃氏插值函数(1-
21、12a)式,这个(2n+1)次的插值多项式函数可表为: (-24)其基函数,(i0,1,2,,n)按(-13)格式可表为: (i0,1,2,,n) (1-25)其中: 同(1-19),即为拉氏插值的基函数;同(1-20)。该插值的余项为: (1-26)具有(2n+1)阶导数的逼近性。埃氏插值的几何意义是:插值函数()与原函数()在节点处即“等值”又“公切”。埃氏插值还可推广到包含更高阶导数以及各节点包含的导数阶不均等的情况。1.4 关于多项式插值的稳定性根据拉氏和埃氏插值的余项公式(1-22)和(1-23),似乎表明插值的次数愈高精度愈高,贴近效果愈好。其实并非如此。分析如下:在插值过程中一般
22、误差来自于两个方面的误差:1. 原函数f(x)被插值函数F(x)代替所引起的原理性误差,即余项E(x)=f(x)-F(x)(截断误差),其误差分析即为余项公式。2. 节点数据发fi本身误差(实验误差,或计算过程中的舍入误差),从而引起插值过程的不稳定。而后一种误差在插值过程中可能被扩散和放大,从而引起插值过程的不稳定,这就是所谓插值过程的稳定性问题。对1项的误差已有定量的估计公式。这里仅对2项以拉氏插值为例进行分析:设:fi为真值,实际值为,即为误差(i=0,1,2.n),即真值fi被近似为。为依据值确定的插值多项式,则此时的插值结果的误差余项为:该误差为两部分的迭加,显见:第一项即为节点函数
23、值为真值的插值余项。而第二项即为节点函数值无误差和有误差两种情况下插值函数之间的误差。根据插值公式(1-18)的关系式,它可表为:表达式见(1-19),此式表明在节点上的数据误差将通过基函数的作用向两边扩散乃至放大。鉴于此,基函数亦起着“误差传递函数”的作用。下图示意出的作用。即内插时,在基本区间内呈波动状,而在基本区间之外,之值则按距离或的n次幂放大,故当n较大时,插值过程对于样点的数据误差就越发敏感。可见,高次插值具有较强的数值不稳定性的缺点。为了说明这一点,引用一例(数值逼近p.66)例:原函数 ()取等距节点:(i=0,1.10),求拉氏插值多项式F(x)。插值结果见图。可见在0,0.
24、2范围内F(x)与f(x)尚能较好地逼近,但当插值点x越趋向于区间端点,逼近的效果就越差(见下表)。0.10.800000.843400.30.307690.235350.50.137930.253760.70.07547-0.226200.90.047061.57872并且在区间的两端出现大幅度的波动,这种现象称为龙格(Rangu)现象(戏称“龙摆尾”)。由于龙格现象的存在,显然,一味地提高插值多项式的次数是不可取的。实践中,插值次数高于6-7就很少采用。当节点数很多时,一般是采用分段低次多项式插值的方法,这样的插值函数既简单又可避免“龙格”现象,提高了插值精度。分段多项式插值的两种类型:1
25、. 局部化的分段插值简单低阶多项式插值的直接应用(见图)。2. 非局部化的分段插值(样条插值)构成略为复杂。局部化分段插值的稳定性由于分段插值法是用各个子区间上的低次多项式“装配”或“拼凑”起来的,且在拼接点处函数连续甚至一阶导数亦连续,因此,保证了插值函数在整体上有一定的连续性和光滑性。此外,由于每个子区间上的插值函数仅由本区间段内一些特定节点值确定的,而与该区间之外的其它节点无关,因此,具有“局部化”特征,这体现在每个基函数都是紧凑函数,只在一个局部范围内不为0,超出这个局部范围恒为0。由前知,基函数亦为“误差影响函数”,基于这种基函数紧凑性的特性,使得每一节点的值只影响相邻的一两个子区间
26、而不远及。这样,节点数据误差基本上不扩散,不放大,从而保证了当节点数n递增时插值过程的数值稳定性。Chapter2 曲线曲面拟合问题2.1 问题提出与基本方法一. 问题提出在自然科学和工程中常常寻找经验公式的问题。即由观测或实验测得的物理量x和y的一组数据。我们通过这一组数据希望找出能反映这两个物理量x与y之间的因果或依赖关系(即经验公式或数学关系式),即需确定函数关系y=g(x).将上述问题提炼为数学问题如下: 给定数据(散布点) (1.1) 确定x的连续函数y=g(x),使之对数据(1.1)的“拟合程度为最好”。其中g(x)表示一个函数关系式,它可以是线性函数,亦可以是非线性函数,可以是多
27、项式函数,亦可以是其它类项的函数,其函数类型将由人根据x与y之间的依赖关系或经验选定。 简例:先看一个曲线拟合最简单的例子已知观测值见下表: kxkyk122.01242.98353.5485.02595.47其在x-y平面上的散布图为:由散布图易见,这些观测值点大体上分布在一直线附近,我们即可认为x与y之间存在线性依赖关系,为此,我们设x与y之间的函数表达式为: (1.2)其中:b0、b1为两个待定的参数,它们几何意义分别表示待求直线方程的截距和斜率。确定待定参数b0、b1的方法将取决于使数据与待求直线两者之间“最佳拟合”准则,不同的拟合准则对应于不同的求解方法。通常人们总是以最小二乘原理作
28、为最佳拟合准则,这是由于该方法对拟合的残差易于计算,求解拟合曲线中待定参数方法非常规范。故本课程关于曲线拟合问题着重学习此方法。二 基本方法- 最小二乘方法这是一个古老和有效的方法,至今在许多工程的数学问题中任然频繁使用。其基本思想是:使待拟合的函数曲线y=g(x)与诸散布点之间误差的平方和最小化(称为最佳平方逼近)。具体方法为:在简例中,我们设:因变量y的估计值y*与自变量x的观测值之间有(1.2)式给出的线性函数关系,即: (1-3)由于观测数据的误差和表达式的不精确等等原因,则在所有观测点处,函数的估计值与观测值不可能完全相等,它们之间的残差为: (1-4)反映出一个点处观测值与估计值之
29、间的残差,为了综合考虑所有点处观测值与估计值之间的总残差,故计算出所有点残差的平方和为: (1.5)这里取残差平方和的目的是为了避免各点残差正负抵消。显见,当一组观测值给定之后,残差的平方和Q仅依赖于待定参数b0,b1,即Q为b0,b1的函数。现选择待定参数b0,b1,即使(最小),由函数极值理论,则须有关于可变参数b0,b1的一阶偏导数均为零,即: (1.6)即有: (对称阵)(1.6)是关于未知参数b0,b1的联立代数方程组,此方程组的系数矩阵为对称阵,这一方程组在最小二乘法中称为“正则方程”或“法方程”。从中解得b0,b1,代回到(1.3)式中,即获得自变量x与因变量y之间存在的依赖关系
30、,此关系曲线即为最小二乘意义下的最佳拟合曲线,即用该曲线去拟合给定的散布点,两者之间误差的平方和是最小的。对简例,解得:,则与给定的散布点最佳拟合的直线为:说明(1) 由插值方法所确定的曲线要求必须通过所有给定的样点。而曲线拟合法则不同于此,其特点是所确定出的曲线原则上并不特别要求真正通过所给定散布点的某一个(或某些个),而只要求该曲线尽可能从给定散布点的附近通过。对于含有观测误差的散布点数据来说,不过点的原则显然更为适合,因为这样处理可以部分抵消数据中含有的观测值误差。(2)曲线拟合的前提是如何确定拟合曲线的函数类型或表达形式,此项工作已不完全是个数学问题,必须与客观实际问题密切结合,此项工
31、作已不完全是个数学问题,必须与客观实际问题密切结合,才能得到较好的解决。对于一元函数的曲线拟合问题,我们可将给定的数据,描画在格子纸上,再凭经验和数学知识来确定拟合曲线的函数类型和数学表达形式。在得不到这些信息时,我们通常是取多项式类的函数作为待求的拟合曲线,这是因为多项式类函数形式规律简单,且便于进行积分和微分运算。专心-专注-专业2.2 多元线性中模型中参数确定 前给出的关于一元线性函数模型在拟合中参数确定的最小二乘方法,该方法完全可以推广到多元线性函数模型之中,其数学处理如下:设给定m元线性函数的n对观测值为: (2.1)其中:为m个自变量的第k次的观测值;为因变量的第k次观测值。假设函
32、数y的估计值与之间的依赖关系为线性函数,即经验公式为:(m维空间中的平面) (2.2)其中:为自变量向量;为待定的参数向量(线性组合系数)。为讨论方便,将(2.2)改写为 (2.2.1)其中形式变量我们将(2.2.1)作为由给定n对观测值待拟合的曲(直)线,则诸观测值与经验公式给出的估计值两者之间残差的平方和为: (2.3)显见,当观测值给定之后,Q仅为待定参数的函数,即。 欲使(极小),这将成为一个多元函数的极值问题,由函数极值的必要条件,则应满足下列方程组: (2.4)即: (2.4.1)将方程组(2.4.1)整理归并,改写为正则方程形式: (2.4.2)其中系数和右端项: (2.5)正则
33、方程(2.4.2)是以待定系数为未知量的m+1个联立的线性方程组,其系数矩阵具有正定性和对称性,即(参见(2.5)中第一式可知)。在观测点数目n大于待定参数数目m,即时,它有唯一解。采用线性方程组的各种求解方法,即可求出,从而由(2.2)式为最小二乘意义下的最佳拟合平面。 如果对正则方程(2.4.2)的计算结果精度要求较高,计算时可首先将观测数据进行标准的处理(即作尺度变换),具体可参见(数值计算方法,冯康P.151)。2.3 非线性模型的线性化 上节讨论了线性模型的情况,但在曲线拟合问题中大量存在的却是非线性问题。对于非线性问题,利用最小二乘法去确定其最佳拟合曲线函数表达式,尽管其求解方法与
34、线性问题完全相同,但对应的正则方程确是非线性的。例1 用指数函数去拟合给定数据,其中a,b为待定的常数。若不作任何处理,直接用指数函数去拟合,则拟合的偏差平方和为:其正则方程组为:该正则方程是关于a、b的非线性方程,它的求解要困难得多。能否避免非线性的正则方程,这在许多情况下是可以办得到的。本节将给出如何实现的原则和方法。上节拟合曲线的表达式是标准的线性形式。对实际中一些非标准形式,往往可以通过“变量变换”方法将其转化为标准的线性形式。以下首先通过两个具体例子说明之,再归纳出一般的处理原则。例2(三次多项式)其中为待定参数。作变量变换,令:则原表达式变为:即将原一元三次函数的曲线变为三元一次函
35、数的平面。若将视为自变量,则上式即为标准线性形式,可由上节方法求参数求参数例3. (其中为待定参数)。记:令:则原式化为:标准线性形式(将原三角函数曲线变化四元一次函数平面)。线性化标准的一般方法 通过以上两例,可归纳得出标准线性化处理的一般数学描述为:若待拟合函数为: (3.1)其中: 是变量的已知函数(可以是一元或多元函数)。则可作变量变换: (3.2)将原表达式(3.1)化为标准形式: (3.3)其实以上讨论的变量变换的方法不仅适用于自变量,也适用于因变量y和待定参数bi。例3,为待定参数。两边取自然对数,得:作变量变换,令:则原式化为:(标准线性形式)。由此例不难归纳出标准线性化的最一
36、般公式为:若待拟合函数为: (3.4)其中:为因变量y的已知函数;为自变量(一元多元均可)的某一已知函数;为第i个参数的已知函数,显然它必须为可逆的,以便由经逆变换求得。则可令:则(3.4)式可表为(标准线性化形式)。例4.同例1. 解:两端取对数,则令:,则上式可以表示为:(一元标准线性模型)由线性回归模型求出,再由逆变换得原参数。例5.(李岳生数值逼近P.291) 给定钢包使用次数与钢包的容积的15组试验数据见P.291表6。其在坐标纸上的散布图见下图,求与之最佳拟合的曲线。解:由散布图可见,包容积y与使用次数x之间呈单调增加函数曲线关系,且因容积不会因使用次数增加无限增加,故在曲线尾部接
37、近于平行x轴的渐近线。为了进行拟合函数类型的比较,我们分别取拟合函数关系为双曲线和指数函数两类.(1) 假设为双曲线,即:令:则有:(标准线性模型)求得:从而拟合函数曲线为:(2)假设为指数函数:两边取对数:令:则有:(标准线性模型)求得:从而则拟合函数为:为了比较两种拟合函数的与试验数据拟合的好坏,考查各自函数在试验点处的逼近误差:双曲函数 指数函数 两者在各点处的误差见表7(P.293)由于误差在各观测点处不易比较高低,现比较两者误差的平方和:对双曲函数:误差平方和对指数函数:误差平方和显然,利用指数函数来拟合钢包使用次数与容积之间的近似关系更贴近实际。2.4 非线性模型参数的确定本节将讨
38、论曲线拟合中最一般的模型。设:自变量与因变量通过参数存在着下列关系: (4.1)其中:为待定系数的最一般形式的非线性函数;可以是单个变量,亦可以个变量,即.现给定和的n对观测值,求最小二乘意义的最佳拟合曲线关系式: (4.2)即确定(4.1)中待定参数。上述问题是曲线拟合中的非线性模型,无法像线性模型那样直接求解,而只能采用数值计算中的逐次逼近的迭代方法求解,这种方法的实质就是逐次“线性化”处理。下面介绍针对上述非线性模型中参数确定的一种常用的求解方法,即高斯牛顿法。一 方法原理先给定一个初始值(i=1,2,m),并将与其真值(未知)之差记为,即 (4.3)如此,确定问题化为确定修正值。为建立
39、确定的关系式,将函数在附近用泰勒级数展开,并略去的二次以上各项。即有: (4.4) (4.5.1)即函数在自变量为观测值和参数值取处的函数值,它已是已知的量。 (4.5.2)即函数对bi的偏导数在和处之值,它们亦是已知量。(4.4)中左端的即为因变量y在第k个观测值点处的估计值,它与实际观测值yk之间的“残值”为: (4.6)则在所有n个观测点处残值的平方和: (4.7)使,则须有: (4.8)注意到,已给定,则,即有: (4.8a) 将上式整理归并可得如下方程组(正则方程): (4.9)其中方程组系数 (4.10) (4.11)正则方程(4.9)即为关于未知量的m阶线性方程组,当观测值给定,
40、且参数初值给定之后,系数和右端可按(4.10)和(4.11)关系式求出,由(4.10)可见(i,j=1,2m),即方程组系数矩为对称阵。从(4.9)式中求得修止量,进而得bi的近似值为:(i=1,2m)。若(收敛精度,接近于0的小正数),则以当前bi值作为初值,利用(4.5.1)和(4.5.2)式求出新值处的。再进一步由(4.10)和(4.11)式算出新的和,并重解方程组(4.9)得出第二次修止量,进而得第二次修止后的。重复上述求解过程,直到修止量为止,此时所得即为所求的诸参数。求解原理示意图:以单个参数情况为例。,当(x,y)给定,Q=Q(b)为b的非线性函数。求b*,使。二 求解步骤1.
41、给定初值,并记;给定观测值;2. 将待求函数关系分别代入(4.5.1)和(4.5.2)式,求函数值和偏导数值;3. 利用(4.10)(4.11)求线性方程组系数(i,j=1,2m)和右端项(i=1,2m);4. 解线性方程组(4.9)求出修正项;5. 收敛判别若(i=1,2m),则迭代计算终止,所求参数(i=1,2m);若,则令作为初值,重复步骤24。非线性问题的迭代求解,其难点远不在于具有很大的计算量,而关键在于所构造的迭代计算公式是“收敛”还是“发散”。当然在许多情况下,迭代收敛与否还与初始值的选择具有很大的关系。关于迭代算法的收敛性问题,我们将在下一章中进行讨论。Chapter3 非线性
42、方程的解法3.1 概述工程分析计算、设计和数学物理中的许多问题常归结为求解一非线性方程问题,如:结构的特征值问题中的特征方程即为一高次代数方程;在结构可靠性问题还会遇到求解超越方程。为研究方便起见,将非线性方程用一般形式表为: (1.1)若为的多项式函数,则为高次多项式方程(代数方程)。若为的指数函数、三角函数,则为超越方程。若使,则为方程(1.1)的解(根),或称为函数的零点。对于高次代数方程,其根的个数与多项式次数相同;对于超越方程,其根的个数不定(一个,几个或无穷个)。若对于数有,而,则称为单根;若,而,则称为k重根。 对于非线性方程,除少数特殊方程(如二次多项式方程)可利用公式求解外,
43、一般均无解析解,只能采用数值方法求解。对非线性方程的求解问题一般有如下两种情况:1. 单根求解:求出方程在给定范围内的某个解,即该解的大致位置事先已从问题的工程背景或应用其它方法获知;2. 多根或全部根求解:求出方程在给定区域内的所有解或方程的全部解,但解得个数和位置并不预知。本章将介绍几种求解非线性方程的常用的数值方法。3.2 二分法(区间分半法)这是一种单根求解的方法,其基本过程是:用对半二分法不断缩小方程根所在区间,最终获得根的近视值。求解步骤:设方程在区间a,b内仅有一个根。1. 计算,;2. 取区间的中点,将区间a,b分成两半,并求出;3. 根的扫描:若与同号,则位于的右侧,此时令,goto 4步;若与反号,则位于的左侧,此时令:;goto 4步;经上处理,定位于新区间a1,b1之内,则以a1,