《第九章矩阵特征值和特征向量精选文档.ppt》由会员分享,可在线阅读,更多相关《第九章矩阵特征值和特征向量精选文档.ppt(90页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第九章矩阵特征值和特征向量本讲稿第一页,共九十页特征向量特征向量:已知已知A的特征值的特征值,求齐次线性方,求齐次线性方程组程组 的非零解的非零解x,(,所以有非零解。)为所以有非零解。)为A对应于对应于 的特征向量。的特征向量。如何求解如何求解?特征值特征值:已知:已知A=(aij)nn,求,求A的的特征多项式特征多项式的根的根有有n个零点(实或复,计重数):个零点(实或复,计重数):即求解代数方程即求解代数方程A的特征值本讲稿第二页,共九十页从理论上讲,可利用代数方程求根求出特征值,再利用线从理论上讲,可利用代数方程求根求出特征值,再利用线性方程组的解法,求出特征向量。性方程组的解法,求出
2、特征向量。缺点:工作量大且特征向量对矩阵的依赖很高;当缺点:工作量大且特征向量对矩阵的依赖很高;当矩阵阶数较高时,高次代数方程求根的计算稳定性较差。矩阵阶数较高时,高次代数方程求根的计算稳定性较差。另外,实际问题中的具体要求不同,有时只要求另外,实际问题中的具体要求不同,有时只要求A的绝对的绝对值最大的特征值(主特征值)及相应的特征向量;有时又值最大的特征值(主特征值)及相应的特征向量;有时又要求全部的特征值及特征向量。根据这两种不同要求,求要求全部的特征值及特征向量。根据这两种不同要求,求矩阵的特征值与特征向量的方法也大致分为两类:迭代法矩阵的特征值与特征向量的方法也大致分为两类:迭代法(幂
3、法反幂法)、变换法。(幂法反幂法)、变换法。本讲稿第三页,共九十页关于矩阵特征值及特征向量的一些结论:关于矩阵特征值及特征向量的一些结论:Th1.(i=1,n)为)为A的特征值,则有的特征值,则有 1.2.det(A)=本讲稿第四页,共九十页Th2、A B(相似相似),即存在可逆阵,即存在可逆阵T,使,使B=T-1AT,则则 1.A与与B有相同的特征值。有相同的特征值。2.设设x是是B的关于的关于 的特征向量的特征向量,则则Tx是是A的关于的关于 的特征向量。的特征向量。Th3、(、(Gershgorins定理定理,园盘定理):园盘定理):A=(aij),则则A的每个特征值必在下述某个园盘中:
4、的每个特征值必在下述某个园盘中:A的每行元素确定一个圆盘,共的每行元素确定一个圆盘,共n个。个。Th3 表明表明A的任一特征值必在这的任一特征值必在这n个圆盘中的某一个内。个圆盘中的某一个内。本讲稿第五页,共九十页证明:设证明:设 为为A的任一特征值,的任一特征值,x0为对应特征向为对应特征向 量,则有量,则有(I-A)x=0,设设|xi|=max|xj|,显然显然xi0,第第i个方程:个方程:Th3 的证明过程表明的证明过程表明A的任一特征值必在其对应的任一特征值必在其对应特征向量模最大的分量的指标所对应的圆盘中。特征向量模最大的分量的指标所对应的圆盘中。本讲稿第六页,共九十页 称为称为A对
5、应于向量对应于向量x的的Rayleigh商商。Def1.Ann 实对称阵实对称阵,0 xRn,Th4.Ann 实对称阵,其特征值依次排序为实对称阵,其特征值依次排序为 ,对应特征向量对应特征向量 组成组成规范正交系,即规范正交系,即 ,则,则 1.0 xRn,本讲稿第七页,共九十页2.3.Proof.1.0 xRn,forms an orthogonal basis of Rn,so it is possible to write x as2.where not all could be zero.Thus we have 本讲稿第八页,共九十页=本讲稿第九页,共九十页2.From 1 we
6、know so we only need to prove there exists an x0 such that Taking x=x1,we get3.Proof is similar to 2.本讲稿第十页,共九十页1 幂法与反幂法幂法与反幂法(按模最大与最小特征值的求法)(按模最大与最小特征值的求法)F幂法幂法:求模最大的特征值求模最大的特征值主特征值及相应特征主特征值及相应特征 向量向量的的迭代法迭代法。用用A的乘幂构造迭代序列,因此称为幂法。的乘幂构造迭代序列,因此称为幂法。条件:条件:A Rnn具有具有线性初等因子线性初等因子 A有有n个线性无关的特征向量个线性无关的特征向量。
7、优点:简单,适合稀疏矩阵。优点:简单,适合稀疏矩阵。缺点:有时收敛速度很慢。缺点:有时收敛速度很慢。本讲稿第十一页,共九十页Algorithm 1.suppose A has eigen-values (This implies is a single real root of the characteristic polynomial;else ),and n independent eigen-vectors .Take an initial vector start the iteration system 本讲稿第十二页,共九十页Convergence analysis of Algo
8、rithm 1.本讲稿第十三页,共九十页 is an eigen-vector of A,and is also an eigen-vector corresponding to of A.The same is Eigen-vector本讲稿第十四页,共九十页Eigen value 1本讲稿第十五页,共九十页Th5.A Rnn有有n个线性无关特征向量个线性无关特征向量 主特征值主特征值 1满足满足则则做迭代做迭代有有 本讲稿第十六页,共九十页Principal eigen value 1summaryiteration systemeigen-vector corresponding to
9、1本讲稿第十七页,共九十页1.收敛速度:主要由来收敛速度:主要由来 确定,确定,r 越小,收越小,收2.敛越快。敛越快。时收敛可能很慢。时收敛可能很慢。3.2.若有若有 ,说明,说明10,4.以及以及 都不能作为近似特征向都不能作为近似特征向量,需要重新取初始向量再迭代。量,需要重新取初始向量再迭代。5.3.用幂法进行计算时,若用幂法进行计算时,若 在计算机中会产生在计算机中会产生“溢出溢出”或或 “机器零机器零”的情况(超过的情况(超过计算机字长所能表示的精度)计算机字长所能表示的精度)note本讲稿第十八页,共九十页Algorithm 2(improvement of A.1).本讲稿第十
10、九页,共九十页Convergence analysis of A.2.Max(x)取出向量取出向量x中中模最大的分量模最大的分量本讲稿第二十页,共九十页对应对应 1的特征向量的特征向量x1的的规范化向量规范化向量本讲稿第二十一页,共九十页本讲稿第二十二页,共九十页Th6.A Rnn有有n个线性无关特征向量个线性无关特征向量 主特征值主特征值 1满足满足 则则做迭代做迭代有有 本讲稿第二十三页,共九十页本讲稿第二十四页,共九十页本讲稿第二十五页,共九十页本讲稿第二十六页,共九十页本讲稿第二十七页,共九十页本讲稿第二十八页,共九十页本讲稿第二十九页,共九十页本讲稿第三十页,共九十页本讲稿第三十一页
11、,共九十页本讲稿第三十二页,共九十页本讲稿第三十三页,共九十页2本讲稿第三十四页,共九十页平面旋转矩阵平面旋转矩阵本讲稿第三十五页,共九十页本讲稿第三十六页,共九十页雅可比法的基本思想雅可比法的基本思想:设法用一系列简单的正角阵设法用一系列简单的正角阵Rk,逐步地将逐步地将 A 化为近似对化为近似对角阵角阵(非对角元近似化为非对角元近似化为0)。即选择。即选择Rk,令令 A的全部特征值的全部特征值问题的关键问题的关键:如何构造正交阵:如何构造正交阵Rk?本讲稿第三十七页,共九十页 平面旋转变换平面旋转变换本讲稿第三十八页,共九十页本讲稿第三十九页,共九十页本讲稿第四十页,共九十页本讲稿第四十一
12、页,共九十页本讲稿第四十二页,共九十页本讲稿第四十三页,共九十页本讲稿第四十四页,共九十页本讲稿第四十五页,共九十页本讲稿第四十六页,共九十页本讲稿第四十七页,共九十页本讲稿第四十八页,共九十页雅可比算法雅可比算法:设设Ak-1(k1,A0=A)未对角化,即非对角元中有较大的元素,未对角化,即非对角元中有较大的元素,设非对角元中按模最大的元素是设非对角元中按模最大的元素是引入平面旋转矩阵引入平面旋转矩阵本讲稿第四十九页,共九十页利用利用Rk(p,q)对对Ak-1作旋转变换,使作旋转变换,使 中的非对角元中的非对角元 应满足应满足常将常将限制在限制在本讲稿第五十页,共九十页对对Jacobi算法有
13、几点说明:算法有几点说明:1.构造旋转矩阵时只需计算构造旋转矩阵时只需计算sin,cos,为了防止舍入为了防止舍入误差扩大,误差扩大,sin,cos按下面公式计算:按下面公式计算:否则,否则,本讲稿第五十一页,共九十页本讲稿第五十二页,共九十页 2.由于由于Ak 是对称阵,因此只要计算上三角(或下三角)元素即可,是对称阵,因此只要计算上三角(或下三角)元素即可,既节省计算量,有能保证既节省计算量,有能保证Ak 严格对称。严格对称。3.的计算过程如下:的计算过程如下:本讲稿第五十三页,共九十页 4.Ak 中经旋转变换化为零的元素,可能在中经旋转变换化为零的元素,可能在Ak+1中又成为非零中又成为
14、非零元素,因此不能期望通过有限次旋转变换将原矩阵元素,因此不能期望通过有限次旋转变换将原矩阵A对角化,但可对角化,但可证证 证明证明Jacobi法的收敛性法的收敛性本讲稿第五十四页,共九十页由前面推论知由前面推论知本讲稿第五十五页,共九十页 5.实际计算时,当实际计算时,当k充分大或者当充分大或者当 时迭代终止,时迭代终止,A的全部近似特征值的全部近似特征值 6.特征向量的计算:设经过特征向量的计算:设经过m次旋转变换迭代结束,则次旋转变换迭代结束,则说明说明Pm的第的第j列就是列就是 j的标准正交特征向量的近似值。的标准正交特征向量的近似值。本讲稿第五十六页,共九十页实际计算时,并不是保留实
15、际计算时,并不是保留 到最后才形成到最后才形成Pm,而是逐步形成的。,而是逐步形成的。令令 每一步的计算公式为每一步的计算公式为本讲稿第五十七页,共九十页 7.对经典对经典Jacobi法的改进法的改进-避免每次在非对角元中选避免每次在非对角元中选主元素花费太多时间:主元素花费太多时间:循环雅可比法和雅可比过关法循环雅可比法和雅可比过关法。雅可比过关法雅可比过关法:1.设阈值设阈值T0(一般取为一般取为 ),在,在A的非对角的非对角 元中按行元中按行(或列)扫描(只需扫描上(或下)三角元素),即按如下顺(或列)扫描(只需扫描上(或下)三角元素),即按如下顺序与阈值序与阈值T0作比作比 较:较:若
16、若|aij|j+1时,时,bij=0,则称则称B为上为上Hessenberg阵阵(或准上三角阵或准上三角阵),即,即i=j+1i j+1本讲稿第六十四页,共九十页理论基础:理论基础:A是是n阶实矩阵,存在阶实矩阵,存在正交阵正交阵P,s.t.是是1阶或阶或2阶方阵。若阶方阵。若Aii 是是1阶的,阶的,则它是则它是A的一个实特征值;若的一个实特征值;若Aii 是是2阶的,则它的两个特征阶的,则它的两个特征值是值是A的一对共轭复特征值。的一对共轭复特征值。本讲稿第六十五页,共九十页定理说明:定理说明:用正交阵相似变换可将一般实矩阵约化为上用正交阵相似变换可将一般实矩阵约化为上Hessenberg
17、阵,将实对称阵约化为对称三对角阵。阵,将实对称阵约化为对称三对角阵。正交相似变换不改变特征值和特征向量,因此求原矩阵的特征正交相似变换不改变特征值和特征向量,因此求原矩阵的特征值问题就转化为求上值问题就转化为求上Hessenberg阵或对称三对角阵的特征值问题。阵或对称三对角阵的特征值问题。问题的关键问题的关键:如何将一般实矩阵正交约化为上:如何将一般实矩阵正交约化为上Hessenberg阵,将实对称阵约化为对称三对角阵?阵,将实对称阵约化为对称三对角阵?初等反射阵初等反射阵Def本讲稿第六十六页,共九十页初等反射阵初等反射阵性质性质:对称、正交、对称、正交、对合对合本讲稿第六十七页,共九十页
18、初等反射阵的初等反射阵的几何意义几何意义Swv=x+yyx-yv=x-yv是是v关于平面关于平面S的的镜面反射。镜面反射。初等反射阵将初等反射阵将 Rn 中任意向量关于以中任意向量关于以w为法向量且过原点的超平面为法向量且过原点的超平面做镜面反射做镜面反射。初等反射阵的作用:对向量作变换初等反射阵的作用:对向量作变换本讲稿第六十八页,共九十页Proposition证明:令本讲稿第六十九页,共九十页Corollary本讲稿第七十页,共九十页 本讲稿第七十一页,共九十页结论结论推论说明:通过初等反射阵即可将任何非零向量约化推论说明:通过初等反射阵即可将任何非零向量约化成只有一个非成只有一个非0 0
19、元素的向量。元素的向量。注意:计算注意:计算 时可能上溢或下溢,时可能上溢或下溢,为防止溢出,将为防止溢出,将x 规范化,规范化,本讲稿第七十二页,共九十页用正交相似变换用正交相似变换(初等反射阵初等反射阵)约化矩阵为约化矩阵为Hessenberg阵阵(n-1)(n-1)维维本讲稿第七十三页,共九十页令本讲稿第七十四页,共九十页本讲稿第七十五页,共九十页本讲稿第七十六页,共九十页重复这一过程直到 本讲稿第七十七页,共九十页结论结论本讲稿第七十八页,共九十页设x是c 的对应于的特征向量,则有 说明说明 P x 是是 A 对应于对应于 的特征向量。的特征向量。A的特征值和特征向量的特征值和特征向量
20、本讲稿第七十九页,共九十页若若A是实对称阵,则是实对称阵,则C也是实对称阵也是实对称阵(CT=PTATP=PTAP=C),故故C为对称三对角阵,即为对称三对角阵,即关于实对称阵关于实对称阵本讲稿第八十页,共九十页4 QR方法方法是一种变换方法,计算一般中小型矩阵全部特征值的是一种变换方法,计算一般中小型矩阵全部特征值的最有效方法之一。最有效方法之一。主要用于计算:主要用于计算:1.1.上上Hessenberg阵的全部特征值阵的全部特征值;2.2.对称三对角矩阵的全部特征值。对称三对角矩阵的全部特征值。对于一般矩阵或对称阵,先用对于一般矩阵或对称阵,先用Householder方法将其方法将其约化
21、为上约化为上Hessenberg阵或对称三对角阵,再用阵或对称三对角阵,再用QR法法计算全部特征值。计算全部特征值。优点:算法稳定,收敛快。优点:算法稳定,收敛快。矩阵的矩阵的QR分解分解Lemma1(旋转对向量的作用)(旋转对向量的作用)本讲稿第八十一页,共九十页i行j行i列j列本讲稿第八十二页,共九十页证:证:P左乘左乘x只对的第只对的第i,j个元素有影响,其它元素不变。个元素有影响,其它元素不变。(旋转对矩阵的作用)(旋转对矩阵的作用)A A非奇异,则存在旋转阵非奇异,则存在旋转阵P1,P2,Pn,s.t.为上三角阵,且对角线元素为上三角阵,且对角线元素 Theorem2本讲稿第八十三页
22、,共九十页证明:证明:A=A1非奇异,非奇异,A1的第一列一定存在的第一列一定存在ai10,1.若若ai10,由引理由引理1,存在旋转阵,存在旋转阵 ,s.t.2.同理,同理,若若 ,由引理由引理1,存在旋转阵存在旋转阵 ,s.t.本讲稿第八十四页,共九十页3.重复上述过程,得到重复上述过程,得到 ,s.t.矩阵的矩阵的QR分解分解Theorem3本讲稿第八十五页,共九十页下三角下三角正交阵正交阵上三角阵上三角阵证证(仅证唯一性,反正仅证唯一性,反正):设:设本讲稿第八十六页,共九十页QR算法算法 本讲稿第八十七页,共九十页算法收敛性算法收敛性证明:Th4.在在QR算算法中,有法中,有 本讲稿第八十八页,共九十页Lemma5证证:本讲稿第八十九页,共九十页Theorem6(QR法的收敛性法的收敛性)A非奇异非奇异,且有且有n个不同的特征根:个不同的特征根:定理说明,定理说明,Ak收敛于收敛于上三角阵,其对角线上三角阵,其对角线上的元素就是上的元素就是A的特的特征值。征值。本讲稿第九十页,共九十页