《稀疏编码学习.pptx》由会员分享,可在线阅读,更多相关《稀疏编码学习.pptx(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、稀疏编码如果在矩阵中,多数的元素为0,称此矩阵为稀疏矩阵(sparse matrix)。矩阵中非零元素的个数远远小于矩阵元素的总数,并且非零元素的分布没有规律,则称该矩阵为稀疏矩阵(sparse matrix);稀疏矩阵的计算速度更快,因为M AT L A B只对非零元素进行操作,这是稀疏矩阵的一个突出的优点.第1页/共28页第2页/共28页第3页/共28页稀疏编码是从人的生理特性出发,从而发展起来的。人的视网膜细胞很多,但是对事物敏感的细胞单元去很少,从这点出发,我们可以对输入图像进行稀疏表示,用一组稀疏系数表示,从而达到了对图像信息的压缩。比如把一个句子中的字母比作像素,单词比作经过稀疏表
2、示过后的稀疏元素,那么字典就表示单词和字母的映射关系。单词和字母都可以表示这个句子,但是单词的个数是要远远小于字母的个数,这样字母到单词的转换,就是对这个句子信息的压缩。稀疏编码的背景和含义第4页/共28页将一幅图像中的所有像素排列成一个列向量记为x,xRD,且记基向量集V=v1,v2,v3,vkRD*K,基向量集也称为字典。稀疏编码可以将x表示为 x=uk是第k个基函数的系数,nRD是噪声。稀疏编码概述第5页/共28页其中V就是稀疏字典。图像的字典是由一些原子构成,是对目标的描述。从自然图像中选取而来的,需要经常学习,更新,积累,一步步的完善。如果一个字典是过完备的,那么所有对的图片均可以通
3、过这个字典进行表示。U是稀疏系数,可以看出有较少的非零个数。第6页/共28页字典在多摄像头跟踪中的使用多摄像头跟踪中字典的使用方法有两种。一种是让每个摄像头拥有自己的字典,可以用它自己的字典来表示出出现在它的摄像头中的任何物体,但是由于字典太多,训练任务过于繁重,所以可行性不大。另一种,是试图找到一个过完备字典,能表示出所有摄像头中的物体,这种方法比第一种要实用。第7页/共28页稀疏编码中的两个名词是稀疏字典和稀疏表示。系数字典的生成方法:MOD,RLS-DLA,K-SVD等稀疏表示侧重于用一个给定的字典去表示一个输入信号。稀疏表示常用来进行目标搜索第8页/共28页1稀疏表示概述稀疏表示概述需
4、要克服的困难:需要克服的困难:有效性:噪声、遮挡、视角变化、背景变化、光照变化有效性:噪声、遮挡、视角变化、背景变化、光照变化实时性:视频跟踪要满足实时性实时性:视频跟踪要满足实时性 用稀疏表示的方法,在给定的一个视频序列中,对感兴趣的目用稀疏表示的方法,在给定的一个视频序列中,对感兴趣的目标进行跟踪并且同时识别它。标进行跟踪并且同时识别它。第9页/共28页1稀疏表示概述稀疏表示概述a1+a2+an 目标候选目标候选y y可以由一系列的目标模板线性表示(信号分可以由一系列的目标模板线性表示(信号分解),其中解),其中a a是系数向量。如果是系数向量。如果y y是我们要跟踪的目标,那么是我们要跟
5、踪的目标,那么在对它用目标模板线性表示的时候,只有几个模板前面的系在对它用目标模板线性表示的时候,只有几个模板前面的系数为非零值其它模板前的系数为零值或接近零的值。这就是数为非零值其它模板前的系数为零值或接近零的值。这就是稀疏的由来。稀疏的由来。第10页/共28页2方法详解方法详解琐碎模板琐碎模板 I I1、用来表示噪声等影响2、用来判断目标候选的好坏第11页/共28页I I为单位矩阵,为单位矩阵,e e为琐碎系数向量,为琐碎系数向量,e=e1,e2enTe=e1,e2enT2方法详解方法详解琐碎模板琐碎模板表示噪声等影响表示噪声等影响第12页/共28页2方法详解方法详解琐碎模板琐碎模板判断候
6、选好坏、排除异常判断候选好坏、排除异常第13页/共28页2方法详解方法详解非负性约束非负性约束排除亮度正好相反的候选排除亮度正好相反的候选第14页/共28页2方法详解方法详解非负性约束非负性约束-强制系数强制系数a,ea,e为非负为非负依据:一般而言,系数依据:一般而言,系数a a可以为任意实数,但在实际跟踪可以为任意实数,但在实际跟踪过程中,目标在两帧之间变化很小,系数几乎都是非负的过程中,目标在两帧之间变化很小,系数几乎都是非负的带来的问题:琐碎系数带来的问题:琐碎系数e e有正有负,不能简单的限值为非有正有负,不能简单的限值为非负负解决方法:引入正负琐碎模板解决方法:引入正负琐碎模板第1
7、5页/共28页2方法详解方法详解非负性约束非负性约束-引入正负琐碎模板引入正负琐碎模板 e+e+,e-e-分别为正,负琐碎系数向量。分别为正,负琐碎系数向量。(注意:(注意:a,e+,e-a,e+,e-的值均为非负数)的值均为非负数)第16页/共28页2方法详解方法详解问题:如何应对目标在跟踪过程中姿态、光照、外观问题:如何应对目标在跟踪过程中姿态、光照、外观变化情况?变化情况?解决方法:对目标模板进行动态更新。解决方法:对目标模板进行动态更新。模板更新模板更新目标模板的初始值:第一个目标模板是手动从第一帧目标模板的初始值:第一个目标模板是手动从第一帧图片中选取出来的,其余模板是由这个模板移动
8、几个图片中选取出来的,其余模板是由这个模板移动几个像素点而得到的。像素点而得到的。第17页/共28页2方法详解方法详解何时更新:得到每一帧的跟踪结果后,就会对模板的何时更新:得到每一帧的跟踪结果后,就会对模板的权重进行更新权重进行更新模板更新模板更新第18页/共28页2方法详解方法详解更新方法:更新方法:给每个模板赋以权值以便知道哪些模板能准确的给每个模板赋以权值以便知道哪些模板能准确的表示跟踪目标。表示跟踪目标。模板在跟踪过程中会发生变化:当跟踪结果和某模板在跟踪过程中会发生变化:当跟踪结果和某个模板很相近时,这个模板的权重就会增加,反之就个模板很相近时,这个模板的权重就会增加,反之就会减少
9、。当跟踪结果和当前模板不相似时,它将替换会减少。当跟踪结果和当前模板不相似时,它将替换掉权重最小的模板并且它的权值被初始化为所有模板掉权重最小的模板并且它的权值被初始化为所有模板权重的中值。权重的中值。模板更新模板更新第19页/共28页2方法详解方法详解模板模板更新更新第20页/共28页2方法详解方法详解怎样分类怎样分类传统分类方法:先跟踪后分类传统分类方法:先跟踪后分类存在的问题:怎样挑选帧存在的问题:怎样挑选帧本文分类方法:同步跟踪与分类本文分类方法:同步跟踪与分类每一帧都给出一个分类结果,然后与之前的所有帧的分类结每一帧都给出一个分类结果,然后与之前的所有帧的分类结果进行统计决策果进行统
10、计决策第21页/共28页2方法详解方法详解怎样分类怎样分类引入静态模板引入静态模板假设有假设有K K类需要识别的物体,类需要识别的物体,其中其中 是第是第i i类物体的模板集,类物体的模板集,1ik1ik。它是从视频序列。它是从视频序列中事先训练好的。中事先训练好的。为了便于区分,我们将之前的目标模板为了便于区分,我们将之前的目标模板T T称为动态模板称为动态模板.顾名思义,动态模板在跟踪进程中是需要动态更新的,而顾名思义,动态模板在跟踪进程中是需要动态更新的,而静态模板是一直保持不变的。静态模板是一直保持不变的。第22页/共28页2方法详解方法详解怎样分类怎样分类引入静态模板引入静态模板静态
11、模板集静态模板集 包含目标不同姿势及光照条件下包含目标不同姿势及光照条件下的图片,不仅可以用来识别分类,还可以有效阻止的图片,不仅可以用来识别分类,还可以有效阻止跟踪器在目标发生大幅度的姿势和光照变化时而发跟踪器在目标发生大幅度的姿势和光照变化时而发生漂移生漂移第23页/共28页3总结总结输入视频序列在一桢图像中找出候选,为每个候选进行稀疏表示为每个候选通过求解l1范式最小化求解稀疏系数,排除一些异常对剩余的候选分别计算重构误差找出具有最小重构误差的那一类输出跟踪结果基本思想基本思想第24页/共28页3总结总结同步跟踪同步跟踪与识别算与识别算法法i=1基本思想基本思想+模板更新模板更新+识别识别第25页/共28页3总结总结算法的不足:算法的不足:1 1、实时性不好、实时性不好2 2、当姿态变化很快目标跟踪将会失败。、当姿态变化很快目标跟踪将会失败。3 3、目标暂时完全消失又重新出现时,目标跟踪将会失、目标暂时完全消失又重新出现时,目标跟踪将会失败。败。4 4、当跟踪目标与另一物体非常相似时也会发生错误。、当跟踪目标与另一物体非常相似时也会发生错误。演示实验结果演示实验结果第26页/共28页 Thank youThank you第27页/共28页2023/3/20感谢您的观看!第28页/共28页