《第九章矩阵特征值和特征向量PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第九章矩阵特征值和特征向量PPT讲稿.ppt(90页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第九章矩阵特征值和特征向量第1页,共90页,编辑于2022年,星期二特征向量特征向量:已知已知A的特征值的特征值,求齐次线性方,求齐次线性方程组程组 的非零解的非零解x,(,所以有非零解。)为所以有非零解。)为A对应于对应于 的特征向量。的特征向量。如何求解如何求解?特征值特征值:已知:已知A=(aij)nn,求,求A的的特征多项式特征多项式的根的根有有n个零点(实或复,计重数):个零点(实或复,计重数):即求解代数方程即求解代数方程A的特征值第2页,共90页,编辑于2022年,星期二从理论上讲,可利用代数方程求根求出特征值,再利用线从理论上讲,可利用代数方程求根求出特征值,再利用线性方程组的
2、解法,求出特征向量。性方程组的解法,求出特征向量。缺点:工作量大且特征向量对矩阵的依赖很高;当缺点:工作量大且特征向量对矩阵的依赖很高;当矩阵阶数较高时,高次代数方程求根的计算稳定性较差。矩阵阶数较高时,高次代数方程求根的计算稳定性较差。另外,实际问题中的具体要求不同,有时只要求另外,实际问题中的具体要求不同,有时只要求A的绝的绝对值最大的特征值(主特征值)及相应的特征向量;有对值最大的特征值(主特征值)及相应的特征向量;有时又要求全部的特征值及特征向量。根据这两种不同要时又要求全部的特征值及特征向量。根据这两种不同要求,求矩阵的特征值与特征向量的方法也大致分为两类:求,求矩阵的特征值与特征向
3、量的方法也大致分为两类:迭代法(幂法反幂法)、变换法。迭代法(幂法反幂法)、变换法。第3页,共90页,编辑于2022年,星期二关于矩阵特征值及特征向量的一些结论:关于矩阵特征值及特征向量的一些结论:Th1.(i=1,n)为)为A的特征值,则有的特征值,则有 1.2.det(A)=第4页,共90页,编辑于2022年,星期二Th2、A B(相似相似),即存在可逆阵,即存在可逆阵T,使,使B=T-1AT,则则 1.A与与B有相同的特征值。有相同的特征值。2.设设x是是B的关于的关于 的特征向量的特征向量,则则Tx是是A的关于的关于 的特征向量。的特征向量。Th3、(、(Gershgorins定理定理
4、,园盘定理):园盘定理):A=(aij),则则A的每个特征值必在下述某个园盘中:的每个特征值必在下述某个园盘中:A的每行元素确定一个圆盘,共的每行元素确定一个圆盘,共n个。个。Th3 表明表明A的任一特征值必在这的任一特征值必在这n个圆盘中的某一个内。个圆盘中的某一个内。第5页,共90页,编辑于2022年,星期二证明:设证明:设 为为A的任一特征值,的任一特征值,x0为对应特征向为对应特征向 量,则有量,则有(I-A)x=0,设设|xi|=max|xj|,显然显然xi0,第第i个方程:个方程:Th3 的证明过程表明的证明过程表明A的任一特征值必在其对应的任一特征值必在其对应特征向量模最大的分量
5、的指标所对应的圆盘中。特征向量模最大的分量的指标所对应的圆盘中。第6页,共90页,编辑于2022年,星期二 称为称为A对应于向量对应于向量x的的Rayleigh商商。Def1.Ann 实对称阵实对称阵,0 xRn,Th4.Ann 实对称阵,其特征值依次排序为实对称阵,其特征值依次排序为 ,对应特征向量对应特征向量 组成组成规范正交系,即规范正交系,即 ,则,则 1.0 xRn,第7页,共90页,编辑于2022年,星期二2.3.Proof.1.0 xRn,forms an orthogonal basis of Rn,so it is possible to write x as2.where
6、not all could be zero.Thus we have 第8页,共90页,编辑于2022年,星期二=第9页,共90页,编辑于2022年,星期二2.From 1 we know so we only need to prove there exists an x0 such that Taking x=x1,we get3.Proof is similar to 2.第10页,共90页,编辑于2022年,星期二1 幂法与反幂法幂法与反幂法(按模最大与最小特征值的求法)(按模最大与最小特征值的求法)F幂法幂法:求模最大的特征值求模最大的特征值主特征值及相应特征主特征值及相应特征 向量
7、向量的的迭代法迭代法。用用A的乘幂构造迭代序列,因此称为幂法。的乘幂构造迭代序列,因此称为幂法。条件:条件:A Rnn具有具有线性初等因子线性初等因子 A有有n个线性无关的特征向量个线性无关的特征向量。优点:简单,适合稀疏矩阵。优点:简单,适合稀疏矩阵。缺点:有时收敛速度很慢。缺点:有时收敛速度很慢。第11页,共90页,编辑于2022年,星期二Algorithm 1.suppose A has eigen-values (This implies is a single real root of the characteristic polynomial;else ),and n indepe
8、ndent eigen-vectors .Take an initial vector start the iteration system 第12页,共90页,编辑于2022年,星期二Convergence analysis of Algorithm 1.第13页,共90页,编辑于2022年,星期二 is an eigen-vector of A,and is also an eigen-vector corresponding to of A.The same is Eigen-vector第14页,共90页,编辑于2022年,星期二Eigen value 1第15页,共90页,编辑于20
9、22年,星期二Th5.A Rnn有有n个线性无关特征向量个线性无关特征向量 主特征值主特征值 1满足满足则则做迭代做迭代有有 第16页,共90页,编辑于2022年,星期二Principal eigen value 1summaryiteration systemeigen-vector corresponding to 1第17页,共90页,编辑于2022年,星期二1.收敛速度:主要由来收敛速度:主要由来 确定,确定,r 越小,收越小,收2.敛越快。敛越快。时收敛可能很慢。时收敛可能很慢。3.2.若有若有 ,说明,说明10,4.以及以及 都不能作为近似特征向都不能作为近似特征向量,需要重新取初
10、始向量再迭代。量,需要重新取初始向量再迭代。5.3.用幂法进行计算时,若用幂法进行计算时,若 在计算机中会产生在计算机中会产生“溢出溢出”或或 “机器零机器零”的情况(超的情况(超过计算机字长所能表示的精度)过计算机字长所能表示的精度)note第18页,共90页,编辑于2022年,星期二Algorithm 2(improvement of A.1).第19页,共90页,编辑于2022年,星期二Convergence analysis of A.2.Max(x)取出向量取出向量x中中模最大的分量模最大的分量第20页,共90页,编辑于2022年,星期二对应对应 1的特征向量的特征向量x1的的规范化
11、向量规范化向量第21页,共90页,编辑于2022年,星期二第22页,共90页,编辑于2022年,星期二Th6.A Rnn有有n个线性无关特征向量个线性无关特征向量 主特征值主特征值 1满足满足 则则做迭代做迭代有有 第23页,共90页,编辑于2022年,星期二第24页,共90页,编辑于2022年,星期二第25页,共90页,编辑于2022年,星期二第26页,共90页,编辑于2022年,星期二第27页,共90页,编辑于2022年,星期二第28页,共90页,编辑于2022年,星期二第29页,共90页,编辑于2022年,星期二第30页,共90页,编辑于2022年,星期二第31页,共90页,编辑于202
12、2年,星期二第32页,共90页,编辑于2022年,星期二第33页,共90页,编辑于2022年,星期二2第34页,共90页,编辑于2022年,星期二平面旋转矩阵平面旋转矩阵第35页,共90页,编辑于2022年,星期二第36页,共90页,编辑于2022年,星期二雅可比法的基本思想雅可比法的基本思想:设法用一系列简单的正角阵设法用一系列简单的正角阵Rk,逐步地将逐步地将 A 化为近似对角化为近似对角阵阵(非对角元近似化为非对角元近似化为0)。即选择。即选择Rk,令令 A的全部特征值的全部特征值问题的关键问题的关键:如何构造正交阵:如何构造正交阵Rk?第37页,共90页,编辑于2022年,星期二 平面
13、旋转变换平面旋转变换第38页,共90页,编辑于2022年,星期二第39页,共90页,编辑于2022年,星期二第40页,共90页,编辑于2022年,星期二第41页,共90页,编辑于2022年,星期二第42页,共90页,编辑于2022年,星期二第43页,共90页,编辑于2022年,星期二第44页,共90页,编辑于2022年,星期二第45页,共90页,编辑于2022年,星期二第46页,共90页,编辑于2022年,星期二第47页,共90页,编辑于2022年,星期二第48页,共90页,编辑于2022年,星期二雅可比算法雅可比算法:设设Ak-1(k1,A0=A)未对角化,即非对角元中有较大的元素,设未对角
14、化,即非对角元中有较大的元素,设非对角元中按模最大的元素是非对角元中按模最大的元素是引入平面旋转矩阵引入平面旋转矩阵第49页,共90页,编辑于2022年,星期二利用利用Rk(p,q)对对Ak-1作旋转变换,使作旋转变换,使 中的非对角元中的非对角元 应满足应满足常将常将限制在限制在第50页,共90页,编辑于2022年,星期二对对Jacobi算法有几点说明:算法有几点说明:1.构造旋转矩阵时只需计算构造旋转矩阵时只需计算sin,cos,为了防止为了防止舍入误差扩大,舍入误差扩大,sin,cos按下面公式计算:按下面公式计算:否则,否则,第51页,共90页,编辑于2022年,星期二第52页,共90
15、页,编辑于2022年,星期二 2.由于由于Ak 是对称阵,因此只要计算上三角(或下三角)元素是对称阵,因此只要计算上三角(或下三角)元素即可,既节省计算量,有能保证即可,既节省计算量,有能保证Ak 严格对称。严格对称。3.的计算过程如下:的计算过程如下:第53页,共90页,编辑于2022年,星期二 4.Ak 中经旋转变换化为零的元素,可能在中经旋转变换化为零的元素,可能在Ak+1中又成为非零元素,中又成为非零元素,因此不能期望通过有限次旋转变换将原矩阵因此不能期望通过有限次旋转变换将原矩阵A对角化,但可证对角化,但可证 证明证明Jacobi法的收敛性法的收敛性第54页,共90页,编辑于2022
16、年,星期二由前面推论知由前面推论知第55页,共90页,编辑于2022年,星期二 5.实际计算时,当实际计算时,当k充分大或者当充分大或者当 时迭代终止,时迭代终止,A的全部近似特征值的全部近似特征值 6.特征向量的计算:设经过特征向量的计算:设经过m次旋转变换迭代结束,则次旋转变换迭代结束,则说明说明Pm的第的第j列就是列就是 j的标准正交特征向量的近似值。的标准正交特征向量的近似值。第56页,共90页,编辑于2022年,星期二实际计算时,并不是保留实际计算时,并不是保留 到最后才形成到最后才形成Pm,而是逐步形成的。,而是逐步形成的。令令 每一步的计算公式为每一步的计算公式为第57页,共90
17、页,编辑于2022年,星期二 7.对经典对经典Jacobi法的改进法的改进-避免每次在非对角元中选主元素避免每次在非对角元中选主元素花费太多时间:花费太多时间:循环雅可比法和雅可比过关法循环雅可比法和雅可比过关法。雅可比过关法雅可比过关法:1.设阈值设阈值T0(一般取为一般取为 ),在,在A的非对角的非对角 元中按行元中按行(或列)扫描(只需扫描上(或下)三角元素),即按如下顺(或列)扫描(只需扫描上(或下)三角元素),即按如下顺序与阈值序与阈值T0作比作比 较:较:若若|aij|j+1时,时,bij=0,则称则称B为上为上Hessenberg阵阵(或准上三角阵或准上三角阵),即,即i=j+1
18、i j+1第64页,共90页,编辑于2022年,星期二理论基础:理论基础:A是是n阶实矩阵,存在阶实矩阵,存在正交阵正交阵P,s.t.是是1阶或阶或2阶方阵。若阶方阵。若Aii 是是1阶的,阶的,则它是则它是A的一个实特征值;若的一个实特征值;若Aii 是是2阶的,则它的两个阶的,则它的两个特征值是特征值是A的一对共轭复特征值。的一对共轭复特征值。第65页,共90页,编辑于2022年,星期二定理说明:定理说明:用正交阵相似变换可将一般实矩阵约化为上用正交阵相似变换可将一般实矩阵约化为上Hessenberg阵,将实对称阵约化为对称三对角阵。阵,将实对称阵约化为对称三对角阵。正交相似变换不改变特征
19、值和特征向量,因此求原矩阵的特征值正交相似变换不改变特征值和特征向量,因此求原矩阵的特征值问题就转化为求上问题就转化为求上Hessenberg阵或对称三对角阵的特征值问题。阵或对称三对角阵的特征值问题。问题的关键问题的关键:如何将一般实矩阵正交约化为上:如何将一般实矩阵正交约化为上Hessenberg阵,将实对称阵约化为对称三对角阵?阵,将实对称阵约化为对称三对角阵?初等反射阵初等反射阵Def第66页,共90页,编辑于2022年,星期二初等反射阵初等反射阵性质性质:对称、正交、对称、正交、对合对合第67页,共90页,编辑于2022年,星期二初等反射阵的初等反射阵的几何意义几何意义Swv=x+y
20、yx-yv=x-yv是是v关于平面关于平面S的的镜面反射。镜面反射。初等反射阵将初等反射阵将 Rn 中任意向量关于以中任意向量关于以w为法向量且过原点的超平面做镜面为法向量且过原点的超平面做镜面反射反射。初等反射阵的作用:对向量作变换初等反射阵的作用:对向量作变换第68页,共90页,编辑于2022年,星期二Proposition证明:令第69页,共90页,编辑于2022年,星期二Corollary第70页,共90页,编辑于2022年,星期二 第71页,共90页,编辑于2022年,星期二结论结论推论说明:通过初等反射阵即可将任何非零向量约化推论说明:通过初等反射阵即可将任何非零向量约化成只有一个
21、非成只有一个非0 0元素的向量。元素的向量。注意:计算注意:计算 时可能上溢或下溢,为时可能上溢或下溢,为防止溢出,将防止溢出,将x 规范化,规范化,第72页,共90页,编辑于2022年,星期二用正交相似变换用正交相似变换(初等反射阵初等反射阵)约化矩阵为约化矩阵为Hessenberg阵阵(n-1)(n-1)维维第73页,共90页,编辑于2022年,星期二令第74页,共90页,编辑于2022年,星期二第75页,共90页,编辑于2022年,星期二第76页,共90页,编辑于2022年,星期二重复这一过程直到 第77页,共90页,编辑于2022年,星期二结论结论第78页,共90页,编辑于2022年,
22、星期二设x是c 的对应于的特征向量,则有 说明说明 P x 是是 A 对应于对应于 的特征向量。的特征向量。A的特征值和特征向量的特征值和特征向量第79页,共90页,编辑于2022年,星期二若若A是实对称阵,则是实对称阵,则C也是实对称阵也是实对称阵(CT=PTATP=PTAP=C),故故C为对称三对角阵,即为对称三对角阵,即关于实对称阵关于实对称阵第80页,共90页,编辑于2022年,星期二4 QR方法方法是一种变换方法,计算一般中小型矩阵全部特征值的是一种变换方法,计算一般中小型矩阵全部特征值的最有效方法之一。最有效方法之一。主要用于计算:主要用于计算:1.1.上上Hessenberg阵的
23、全部特征值阵的全部特征值;2.2.对称三对角矩阵的全部特征值。对称三对角矩阵的全部特征值。对于一般矩阵或对称阵,先用对于一般矩阵或对称阵,先用Householder方法将其方法将其约化为上约化为上Hessenberg阵或对称三对角阵,再用阵或对称三对角阵,再用QR法法计算全部特征值。计算全部特征值。优点:算法稳定,收敛快。优点:算法稳定,收敛快。矩阵的矩阵的QR分解分解Lemma1(旋转对向量的作用)(旋转对向量的作用)第81页,共90页,编辑于2022年,星期二i行j行i列j列第82页,共90页,编辑于2022年,星期二证:证:P左乘左乘x只对的第只对的第i,j个元素有影响,其它元素不变。个
24、元素有影响,其它元素不变。(旋转对矩阵的作用)(旋转对矩阵的作用)A A非奇异,则存在旋转阵非奇异,则存在旋转阵P1,P2,Pn,s.t.为上三角阵,且对角线元素为上三角阵,且对角线元素 Theorem2第83页,共90页,编辑于2022年,星期二证明:证明:A=A1非奇异,非奇异,A1的第一列一定存在的第一列一定存在ai10,1.若若ai10,由引理由引理1,存在旋转阵,存在旋转阵 ,s.t.2.同理,同理,若若 ,由引理由引理1,存在旋转阵存在旋转阵 ,s.t.第84页,共90页,编辑于2022年,星期二3.重复上述过程,得到重复上述过程,得到 ,s.t.矩阵的矩阵的QR分分解解Theor
25、em3第85页,共90页,编辑于2022年,星期二下三角下三角正交阵正交阵上三角阵上三角阵证证(仅证唯一性,反正仅证唯一性,反正):设:设第86页,共90页,编辑于2022年,星期二QR算法算法 第87页,共90页,编辑于2022年,星期二算法收敛性算法收敛性证明:Th4.在在QR算算法中,有法中,有 第88页,共90页,编辑于2022年,星期二Lemma5证证:第89页,共90页,编辑于2022年,星期二Theorem6(QR法的收敛性法的收敛性)A非奇异非奇异,且有且有n个不同的特征根:个不同的特征根:定理说明,定理说明,Ak收敛收敛于上三角阵,其对角于上三角阵,其对角线上的元素就是线上的元素就是A的的特征值。特征值。第90页,共90页,编辑于2022年,星期二