视频中单个运动物体的跟踪.docx

上传人:温桑 文档编号:49455364 上传时间:2022-10-08 格式:DOCX 页数:33 大小:5.10MB
返回 下载 相关 举报
视频中单个运动物体的跟踪.docx_第1页
第1页 / 共33页
视频中单个运动物体的跟踪.docx_第2页
第2页 / 共33页
点击查看更多>>
资源描述

《视频中单个运动物体的跟踪.docx》由会员分享,可在线阅读,更多相关《视频中单个运动物体的跟踪.docx(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、编号本科生毕业设计视频中单个运动物体的跟踪The Tracking of the single moving object in the video 学生姓名张涌鑫专业软件工程学号150521103指导教师赵建平学院计算机科学技术学院二一九年六月毕业设计(论文)原创承诺书1本人承诺:所呈交的毕业设计(论文)视频中单个运动物体的跟踪,是认真学习理解学校的长春理工大学本科毕业设计(论文)工作条例后,在教师的指导下,保质保量独立地完成了任务书中规定的内容,不弄虚作假,不抄袭别人的工作内容。2本人在毕业设计(论文)中引用他人的观点和研究成果,均在文中加以注释或以参考文献形式列出,对本文的研究工作做出重

2、要贡献的个人和集体均已在文中注明。3在毕业设计(论文)中对侵犯任何方面知识产权的行为,由本人承担相应的法律责任。4本人完全了解学校关于保存、使用毕业设计(论文)的规定,即:按照学校要求提交论文和相关材料的印刷本和电子版本;同意学校保留毕业设计(论文)的复印件和电子版本,允许被查阅和借阅;学校可以采用影印、缩印或其他复制手段保存毕业设计(论文),可以公布其中的全部或部分内容。以上承诺的法律结果将完全由本人承担!作 者 签 名: 年 月 日长春理工大学本科毕业设计摘要目标跟踪一直以来都是计算机视觉领域的重要的研究方向,在近几年更是发展迅速。但是由于运动的物体自身容易产生形变以及其它外观因素的变化会

3、导致跟踪失败。所以,建立一个稳定的跟踪算法是一项具有重要研究价值的工作。首先,本文详细阐述了跟踪算法的研究现状,以快速压缩跟踪(FCT)算法为研究对象,深入分析了算法的实现过程、优缺点。FCT算法在跟踪的目标周围进行由粗到精的采样后,根据压缩感知理论对正负样本进行降维处理,运用贝叶斯分类器实现目标跟踪。FCT算法的实时性较高,但是在跟踪失败后无法重新跟踪上目标。之后,针对FCT算法在跟丢目标后无法重新跟踪上目标的情况,本文提出利用SURF算法进行目标检测,对FCT算法进行改进。最后,本文根据运动物体的运动速度在相邻帧可以视为一致的原理来做目标受遮挡处理。实验结果表明,改进后的算法的追踪准确度得

4、到提高,同时可以实现实时跟踪。关键词:目标跟踪 快速压缩跟踪 SURF算法 AbstractTarget tracking has always been an important research direction in the field of computer vision, and has developed rapidly in recent years. However, because the moving object is prone to deformation and other appearance changes, target tracking often fai

5、ls. Therefore, the establishment of a stable tracking algorithm is an important research work.Firstly, this paper elaborates the research status of tracking algorithm in detail. Taking fast compression tracking (FCT) algorithm as the research object, the implementation process, advantages and disadv

6、antages of the algorithm are analyzed in depth. FCT algorithm uses the coarse-to-fine sampling around the tracking target,and reduces the dimension of the positive and negative samples based on compressed sensing theory, and uses the Bayesian classifier to realize target tracking. FCT algorithm has

7、high real-time performance, but it can not track the target again after tracking failure.After that, according to the situation that the FCT algorithm can not track the target again after losing the target, this paper uses SURF algorithm for target detection and improves FCT algorithm. Finally, this

8、 paper uses the principle that the velocity of moving objects in adjacent frames can be regarded as the same to be occluded. The experimental results show that the tracking accuracy of the improved algorithm is improved. At the same time, the improved algorithm can achieve real-time tracking.Key wor

9、ds: Target tracking; Fast compressive tracking; SURF algorithm27目录摘要IAbstractII第1章 绪论11.1 课题研究目的和意义11.2 国内外研究现状11.2.1 国内研究现状11.2.2 国外研究现状21.3主要工作和组织结构31.4 本章总结3第2章 预备知识42.1 OpenCV函数库42.2 图像处理知识42.2.1 图像灰度化42.2.2 图像卷积42.2.3 图像压缩52.3 压缩感知理论52.4 贝叶斯分类器62.5 本章总结7第3章 FCT算法相关内容83.1 FCT算法简介83.2 获取目标区域的特征83

10、.3 图像特征压缩93.4 贝叶斯分类器103.5 算法的运行流程113.6 本章总结12第4章 算法的改进134.1 基于SURF算法的目标识别134.1.1 构造Hessian矩阵来提取特征点134.1.2 特征点匹配144.1.3 SURF算法的实现以及实现效果144.1.4 结合SURF算法的FCT算法154.2 目标受遮挡处理184.3 本章总结19第5章 实验结果205.1算法的实际运行效果比较205.2算法的跟踪准确度比较215.3算法的实时性比较235.4本章总结24第6章 总结25参考文献26致谢27第1章 绪论1.1 课题研究目的和意义视频中目标跟踪是指利用算法跟踪视频运动

11、的目标,并将不同图像序列的同一目标一一对应起来。它是智能视频监控的一项较为重要的技术,它的算法的优劣直接影响了一个智能监控系统的稳定性与健壮性。同时随着图像处理技术的不断发展,视频中的目标跟踪技术在移动机器人、车辆无人驾驶、战车与坦克的设计、飞机导弹以及医学图像分析等发挥着重要的作用1。具体来说,视频中的目标跟踪算法在智能视频监控上的使用包括了运动物体识别、自动化监测等;在交通监视的应用包括了车辆识别、分析实时车流情况以及收集交通数据等;在移动机器人的应用包括避免发生碰撞以及计算运动目标的移动轨迹等;在医学诊断上的使用包括利用跟踪技术分析医学超声波图像以及医学核磁图像等。人类的感觉主要是用来协

12、助人类来识别身体周围的物体,它是人类与周围事物联系的主要桥梁。人们常常用它来判断物体和物体之间的关系,也就说是它可以帮助我们建立起思维和周围事物的关系。而在人类感觉的获取途径中最主要的就是视觉系统。事实上,据一些学者做出的统计结果可得,人类大部分时间都是通过分析眼睛摄取的图像来获取外界信息。但是人类只有有限的精力,人类能够从眼睛获取到的视觉信息是有限的。所以计算机必须要实现相对的智能化,必须要能够读取并且读懂图片的信息来协助人类去分析图像信息。因此建立一个较为稳定的跟踪算法对于现在的计算机视觉领域来说是非常有必要的。就目前市场流行的智能监控系统来说,新一代的智能监控系统会更受到消费的青睐。和旧

13、一代的监控系统相比,它将会表现得更加智能,完全可以在一些情景中减少人力资源的使用。它能在高层次语义的基础上解释场景中物体行为以及它们的相互关系,使智能监控系统能够了解视频中是某种物体在做某种行为,并且用人类的语言来描述计算机所理解的一切行为。因此,在现在许多国家的实验中都开始投入大量的资金和人才资源到目标跟踪算法的研究当中。1.2 国内外研究现状1.2.1 国内研究现状在目标跟踪算法方面,我国的研究机构和高校研究项目组一直都投入了大量的精力和人才资源。要实现目标跟踪检测并不是一个简单过程,因为在运行中的目标往往会受到光照,形态变化,物体模糊等因素的影响2等。在我国,现在有许多的公共场所和个人私

14、人场所都装上了智能化的监控系统,这在一定程度上也提高了我国的智能监控技术的发展水平。除此以外,国家政府在近几年也在不断增加投入资金比例和人才资源到这方面的研究。但是我国在这方面的相关技术的研究起步时间比较晚,所以我国在这方面的技术的研究仍处于起步并且不断发展的阶段。而在中国的军事战争指挥上对智能监控的技术有更加严格的精度要求,因为在战场上有可能因为一个计算误差导致战争的失败。在当前,我国的军用无人机技术已经取得了一定的成功案例,这也在一定的程度上不断地推动我国的目标检测技术的发展。总的来说,我国的智能监控系统的发展还没有非常成熟,至今还没有研究出完全智能化、完全自动化的监控系统。也就是,在智能

15、监控方面,我们还有许多没有探索到的地方,我们国家在这方面的技术还有较大的提升空间。在我国的一些研究起步较早的机构或者高校中,中国科学院的视觉监控研究小组就是目标跟踪算法领域的佼佼者。该研究小组在交通实际场景的智能车辆监控系统方面、人的运动检测方面和行为模式识别方面都获得了研究成果。英国雷丁大学在1998年便开始和研究小组的模式识别实验室进行研究合作,英皇协会也在这段时间内给该研究小组一定的支持,并且该实验室在智能化交通监控也和波尔多第三大学一起开展过相关的研究。当然,一些其他的高校也都有开展这方面的研究工作,例如上海交大、西安电子科技大学都有成立相关的研究项目组并且取得了一定的研究成果。为了加

16、快国内智能监控系统的发展进程,在2002年和2003年中科院自动化研究所举办了两次全国智能监控会议3。同时,一些较为知名杂志也都开始刊载智能监控的介绍以及相关技术的介绍。1.2.2 国外研究现状国外对视频中物体的跟踪理论和算法研究起步时间较早,特别是国外的一些发达国家已经开展了许多相关科研项目,他们已经取得了一定的研究成功案例。美国国防研究项目署曾经在20世纪末成立了一个非常重要的视觉监控技术项目VSAM,它的主要参加成员有卡内基梅隆大学、麻省理工等一些外国知名院校4。该项目是为了开发出一种自动视频理解新型技术,使计算机能够自己读懂输入的图像,尝试着取代日常生活中的一些人力监控资源,节约监控成

17、本和实现一些高成本的监控。除此之外,美国麻省理工在这些方面的研究也是做得非常全面,它所研究得算法已经实现对行人以及车辆的跟踪和检测,并且应用到了其开发的监控系统中。关于行人和车辆检测跟踪算法方面,英国的雷丁大学也较早开始开展了这方面的研究。马里兰大学也开发了相关的W4智能监控系统,不仅实现了实时监控,而且能够实时定位出行人的各个身体部位。它还实现了同时对多个行人进行监控和检测,并用高层次语义上解释视频中人们的交互行为。国外的很多公司也正在逐步尝试把人脸识别和手势识别的接口应用到商业领域上。1.3主要工作和组织结构本文主要工作是研究视频中单个运物体的跟踪,以FCT算法为研究对象,在实现算法后,本

18、文提出它的改进算法,在原有的FCT算法中加入基于SURF算法的目标匹配算法和受遮挡处理来提高FCT算法的跟踪准确率,实验结果表明,算法的跟踪准确率得到提高以及能够实时运行。本文的其余部分组织结构如下。第2章详细介绍了本文会用到的一些基础理论知识。第3章具体介绍了FCT算法的实现原理、相关算法流程以及算法的优缺点。第4章介绍了本文提出的算法改进的具体方法和实现步骤。第5章给出了实验结果,并与其他的目标跟踪算法进行了比较。第6章总结进行了本文的总结并分析本文的不足以及今后研究发展方向。致谢语中表达了由衷的感谢。1.4 本章总结视频中运动物体的跟踪是智能监控系统中的研究热点课题之一,具备着重要的实际

19、应用前景,但是由于在运行中的物体经常会有形态、光照等因素的变化,所以建立一个非常稳定的跟踪算法还是一项具有挑战性的工作。而在国内开展该算法的研究时间比较晚,仍处于初级阶段。而在外国开展视频中物体跟踪算法的研究的起步时间较早,在相关方面的技术研究比较成熟。第2章 预备知识2.1 OpenCV函数库OpenCV是在做视觉领域方面研究中经常会使用到的计算机视觉函数库,它可以运行在Linux、Windows以及Android等操作系统上。它不仅运行速度快而且提供了C+、Python、MATLAB等多种编程语言的接口。而且关于这些接口函数的使用说明都可以通过OpenCV官网的在线文档获取。OpenCV已

20、经实现了计算机视觉领域的很多经典算法,并且封装起来供用户调用。它也提供了许多关于机器学习模块方面的函数接口,我们可以使用提供的函数来实现正态贝叶斯、支持向量机、随机森林以及神经网络等经典机器学习算法。OpenCV的应用十分广泛,包括计算机视觉领域的目标跟踪、目标识别、人脸识别、图像拼接、图像降噪等算法的研究。而在日常的应用中,它的应用包括为医学图像降噪、汽车自动驾驶的设计、电子设备人脸识别解锁以及智能监控系统的开发等。本文使用的版本为OpenCV 2.4.9,主要使用函数库来完成打开视频文件、提取视频文件的帧图像、图像灰度化、调节图像尺寸、图像卷积操作以及图像采样等操作。2.2 图像处理知识在

21、整个算法的实现和改进过程中,使用了许多有关于图像处理知识,例如图像灰度化、图像采样、图像卷积以及图像压缩等。下面将简单地介绍这些图像处理知识。2.2.1 图像灰度化在进行图像预处理时,我们需要将彩色的图片灰度化,将原来的彩色图片转化为黑白图像。在一张已经灰度化后的图像上的每个像素的颜色的值称为灰度值,灰度值的范围为0到255。灰度化后的图像没有色彩,即在图像中RGB的色彩分量全部相等。本文使用的是OpenCV的库函数来实现灰度化处理,OpenCV在将彩色图像转化为灰度化图像的常用的方式为加权平均法:Grayi,j=0.299*Ri,j+0.578*Gi,j+0.114*Bi,j(2-1)其中G

22、rayi,j为在像素点(i,j)的灰度值,Ri,j、Gi,j、Bi,j为像素点(i,j)的R值、G值以及B值。2.2.2 图像卷积图像卷积指的是利用一个卷积核对所有像素进行数值计算,求权平均计算后的值为新的像素值。卷积核一般指的是一个矩阵或者像素区域,并且它的每个元素上都具有一个权重值。在进行卷积操作时,需要将卷积核的中心元素位置放到待计算的像素点上,将卷积核的权重和覆盖的像素求和平均得到的值为新的像素值。假设原始的图像矩阵M为:M=a11a12a13a14a15a21a22a23a24a25a31a32a33a34a35a41a42a43a44a45a51a52a53a54a55(2-2)卷

23、积核矩阵N为:N=w11w12w13w21w22w23w31w32w33(2-3)在进行卷积操作时,需要将卷积核的中心元素位置放到待计算的像素点上,求权平均计算新的像素值。例如第二行第三列新的像素值计算公式为:a23=w11a12+w12a13+w32a33+w33a34(2-4)计算每个像素点得到新的矩阵便为卷积操作后得到的矩阵。在计算中常见的卷积核有低通滤波器、高斯滤波器以及边缘检测滤波器。2.2.3 图像压缩在图像数据中,经常会存在着同一物体的相邻像素间具有相关性而导致数据冗余等现象。在信息时代,图像数据的冗余往往会增加数据存储和传输的工作量,所以我们需要对图像数据进行有效地压缩。图像压

24、缩可以分为有数据有损坏压缩和数据无损坏压缩。对于比较精密的技术图像时优先采用数据无损坏压缩,例如医院的医学图像以及工业精细的原件组成图等对细节要求较为严格的图像。数据有损压缩方式非常适合用于用在当今流行的聊天表情包中或者一些自然的图像中。细小的数据丢失往往不会给这些图片带来太大影响,有些数据损失甚至是肉眼观察不出来的。图像有损压缩往往是利用算法找到像素的相关性,利用相关性来对图像进行压缩。图像无损压缩则只保存一次图像中所有相同的颜色信息,并根据区域颜色是否相同来保存图像信息。图像数据无损压缩相对于有损压缩来说能够更好地保存图像的信息,但是有损压缩拥有更高的压缩率。2.3 压缩感知理论随着数字化

25、技术的不断发展,数字化电子产品已经普遍出现在了我们周围,并且在不断地影响我们的生活。在这种数字化时代,人们对于多媒体的质量要求越来越高,所以数字信号的采集和存储的工作量将会变得十分巨大,而相对应的信号采集和信息存储设备也都在面临着十分大的压力。在图像数据中往往会存在一些表面物理特征具有相关性的规则物体或者背景,例如在图片中的一片海洋或者蓝天,它们存在着许多相同的像素点,如果我们完全把这些像素点存储起来则会造成数据的空间冗余,所以我们需要对的数据进行压缩降维。压缩感知5就是感知压缩,即在采集的或者存储信号的时候,直接采集或者存储有效的M个测量值,而不是全部的N个数据值,其中MN。它的原理是当图像

26、表现为稀疏或者是可压缩的时候,我们则可以找到一个线性投影的方式来将信号投影到低纬空间,然后得到的低维数据能够较为完美地重建原来的数字信号。由压缩感知理论可知,如果某稀疏信号zRN,而已知测量矩阵RMN,其中MN,而yRM为z在测量矩阵下的线性测量值。y=z(2-5)在公式2-5中,如果测量矩阵能够满足约束等距性条件我们便可以通过观测值y准确地重新构建出z。而对于一个信号f,如果它在某组基下可以表示成:f=x(2-6)我们就可以把x为信号看成f的K稀疏表达,其中K为x中的非零项个数。结合上面的式子,如果信号f在变换域中可以变换为x,我们将f=z代入公式2-5即有:y=f=x=x(2-7)这样只要

27、新建的测量矩阵满足约束等距性条件,我们便可以通过观测值y准确地重新构建出图像信号f,其中=为MN矩阵。当测量矩阵与变换域不相关时,便能满足约束等距性条件。而当为高斯随机矩阵时,在一般情况下都能满足约束等距性的条件。换句话说,关于一个可压缩的图像信号f1,我们要如果要获得它的压缩特征表示y1,我们可以使用一个能使公式2-7中的满足约束等距性条件的高斯随机矩阵1来对图像信号f1进行降维得到压缩特征表示y1。2.4 贝叶斯分类器贝叶斯分类器6是一个常见的分类算法,在算法过程中往往会得到训练数据以及一些待分类项目。对于得到的待分类的项目,我们需要计算待分类的项目在已经有的各个类别会出现的概率。如果待分

28、类项目在某个类别出现的概率最大,那么可以判断得出这个待分类的项目属于这个类别。设待分类项目X为:X=x1,x2,x3,xm-1,xm(2-8)得到的已经知道有类别的训练数据集合为:C=Y1,Y2,Y3,Yn-1,Yn(2-9)计算待分类项目X在已知类型训练数据集合C的各个项目的最大概率为:PYkX=maxPY1X,PY2X,PYn-1X,PYnX(2-10)其中,X属于Yk类别,已知在C中的类别属性为条件独立的,根据贝叶斯定理有:PYiX=PXYiPYiP(X)(2-11)在上式中,P(X)为对于所有已经知道的类别为常数,所以只要PXYiP(Yi)取得最大值,PYiX便能取得最大值。又因为X中

29、的各项属性是符合条件独立的,所以:PXYiPYi=Px1YiPx2YiPxmYiPYi=P(Yi)j=1mPxjYi(2-12)所以要求的待分类项目的在C的各个项目的最大概率便转化为:PYkX=maxP(Yi)j=1mPxjYi(2-13)所以,最后得到的Yk就是待分类项目X在已知的训练数据集合C中的分类结果。2.5 本章总结在本章中,主要介绍了本文将会使用到的一些理论知识。首先介绍了OpenCV函数库的相关知识,接着介绍了图像灰度化、图像卷积、图像压缩等本文常用到的图像处理理论知识。之后非常详地介绍了压缩感知理论以及贝叶斯分类器的原理,为后面算法的介绍奠定了基础。第3章 FCT算法相关内容3

30、.1 FCT算法简介FCT算法7(快速压缩跟踪算法)是在标记视频中要跟踪的物体后,使用矩阵滤波替代高斯滤波器来对标识的目标图片进行卷积提取图像特征,提高了运算速度,接着利用压缩感知来对获取到的高维图像数据做降维处理,最后利用降维后的图像数据训练贝叶斯分类器,而后续的帧的目标跟踪便可以看作是贝叶斯分类器分类问题,分类器响应值取值最大的目标位置便是算法跟踪到的目标位置。FCT由于使用局部压缩特征,所以具有较快的运行速度,但是算法在跟踪到负样本后没任何补救措施,限制了FCT算法的跟踪准确率。3.2 获取目标区域的特征在标记需要检测的目标后,需要得到描述图像的多尺度特征矩阵来表示目标的特征。所以会使用

31、大小不一样的高斯滤波器来和和待处理图像进行卷积操作。但是高斯滤波器在算法运行过程中会带来较大的计算量,所以FCT算法使用矩形滤波器来和图像做卷积操作。经实验证明8,这样使用并不会对特征的表达造成太大的影响,而且能极大加快其卷积速度。如果一个图像的大小为wh,我们令矩形框的大小为Fw,h。Fw,h=1wh*1, 1xw,1yh 0, otherwise(3-1)目标区域的特征获取的流程如下图2-1所示:图3-1 矩阵滤波获得目标特征当目标图像经过矩阵滤波卷积以后,我们得到的矩阵大小仍然是wh。为了方便计算,我们把矩阵做了一些简单的处理,我们把大小为wh的矩阵转化为一个具有wh项的列向量x1,x2

32、,x3,xwh。一个目标图像中一共有wh个卷积结果,如果把这些卷积结果相连接起来将会变成一个具有(wh)2的列向量X,其中:X=x1 x2 x3 x(wh)2(3-2)这样连接以后,X将会变成具有非常多元素的列向量,它的大小将会达到1061010,故在以后的计算中需要对此数据进行降维处理。FCT算法根据压缩感知的理论来对这一个庞大的向量来进行特征压缩,构造一个变化基不相关的稀疏测量矩阵来将高维数据投影到低维的空间中,并且降维后的向量能够保持原来向量的大部分特征信息。3.3 图像特征压缩根据压缩感知的理论可得,在大多数情况下如果一个图片数据是可压缩的,我们只要用小部分的随机生成的线性数据就可以保

33、留原来图像信息中的一些显著信号,并且能够根据生成的随机信号和保留的显著信号就能重建原来的信号。一般情况下图片中会有一部分信息是冗余的,这些数据在一定的情况下是可以压缩的,我们可以用少部分的数据来表示原本的高维图像数据,然后抛弃图像数据原本大量的非重要数据。这样的降维操作有效可以减少数据的存储空间和加快算法的运算速度。而在随机投影中,行具有单位长度的随机矩阵RRnm能将数据从高维特征空间xRm投射到低维空间xRn,其中nm。V=RX(3-3)在这里R为我们构造的稀疏随机矩阵,而X则是我们获取到的高维图像特征,V代表的是降维处理后的低纬向量。矩阵RRnm必须能使公式2-7中的满足约束等距性条件。而

34、典型的满足能使公式2-7中的满足约束等距性的就是高斯随机矩阵,FCT算法中的高斯随机矩阵的定义如公式3-4所示。rij=+1, p=12 0, p=11- -1, p=12 (3-4)经证明,在公式3-4中,当取1或者3时,公式2-7中的测量矩阵将会符合约束等距性的条件。而且当取3时,该矩阵将会有三分之二为0,这样会大幅度地减少计算压力。所以我们可以把这个稀疏随机矩阵R和获取到的图像高维向量X相乘,得到较小的向量V,来实现对高维图像数据X的降维处理,如图3-2所示。图3-2 利用稀疏矩阵进行降维处理从图3-2中可以看出,Rnm矩阵包含的非零项比较少,可以减少降维时的数据运算量。而在降维后的V中

35、的每个元素代表向量X中对应的R项非零项之和,V的一个元素代表的是的是图像数据信号中多个局部信息之和。3.4 贝叶斯分类器FCT算法中在将获取的图像信息降维后,利用贝叶斯分类器6将目标跟踪问题变成贝叶斯分类器分类问题。Hv=logi=1npviy=1py=1i=1npviy=0py=0 =i=1nlogp(vi|y=1)p(vi|y=0)(3-5)在这里py=1=p(y=0)以及y0,1是表示样本标签的二进制变量。文献8中Diaconis和Freedman阐述了高维矩阵随机投影到低维向量后一般情况下都会满足高斯分布的条件。 因此,假设条件分布p(vi|y=1)和p(vi|y=0)的分类器H(v)

36、是具有四个参数(i1,i1,i0,i0)的高斯分布。Pviy=1Ni1,i1Pviy=0Ni0,i0(3-6)而在贝叶斯分类器中,追踪到的目标便是在分类器中响应值H(v)取得最大值时对应的样本。而此时对应的样本并没有区分正负样本,只要取得最大响应值maxHv后的样本便会被视为追踪到的目标区域。而在获取到最新的目标区域后,在区域周围进行采样并且更新贝叶斯分类器,准备开始追踪下一帧的目标。而关于参数的更新如下:i1i1+(1-) 1(3-7)i1(i1)2+1-12+(1-)(i1- 1)2 (3-8)在这里是一个学习参数,0,如果 的值变小,说明目标模板的更新速度在变快。3.5 算法的运行流程输

37、入:第t帧图像(t2),It-1运行步骤如下:1. 在图像中标记出追踪的目标位置,用变量box记录下来。2. 根据图像的高和宽和目标位置来初始化参数。3. 分类器的采集采用先粗后精的策略,首先我们需要在目标周围以较大的步长采取正样本集:Dc=ZIZ-It-1c,其中It-1是在t-1图片中的跟踪到目标的位置。其中c为采样的步长,最后通过压缩理论计算得到它们的低维特征值V(Z)。4. 根据公式3-5中的式子,使用分类器H计算每个特征向量V(Z)的分类器最大响应值maxHv,这样就可以找到分类器中跟踪到的位置It。5. 根据第4步中追踪到的目标It,在It附近周围进行较精细的步长采样得到新的正样本

38、集:Dc=Z|IZ-It|f,其中It是第4步中跟踪到的新的追踪位置,f为采样的步长,最后提取他们具有低纬度的特征V(Z)。6. 根据公式3-5中的式子,使用分类器H计算每个特征向量V(Z)的分类器最大响应值maxHv,这样就可以找到分类器中跟踪到的位置It。7. 在第6步中跟踪到的位置It附近进行正样本集和负样本集的采集:D=Z|IZ-It|和D,=Z|IZ-It|,其中。8. 根据公式3-7以及公式3-8进行分类器参数的更新。输出:算法追踪后的目标位置It和新的贝叶斯分类器参数。而对于第一帧图像,在图像中标记出需要追踪的物体的位置,用变量box记录下来,直接在标记的目标周围采集正负样本,然

39、后提取它们的低纬压缩特征。然后用这些低维特征初始化训练分类器,接着以较大的步长在目标周围采样,将得到待测样本降维后,利用分类器计算响应值最大的目标样本。而接着在得到的目标样本周围继续以较小的步长进行采样,将得到的待测样本降维后,再次利用分类器计算响应值最大的目标样本便是算法跟踪到的下一帧的目标位置,算法步骤如图3-3所示。图3-3 算法的主要流程3.6 本章总结本章主要介绍了FCT算法的用到的相关理论知识以及主要它的主要算法运行流程,FCT算法在获取到标记的跟踪对象以后,利用矩阵滤波代替高斯滤波获取跟踪对象周围的高维图像特征,然后根据压缩感知理论将高维的图像特征随机投影到低维空间中,最后利用这

40、些低维特征训练贝叶斯分类器后将跟踪问题变成贝叶斯分类器分类问题,而最终响应值最高的目标位置即为算法的跟踪位置。对于FCT算法来说,它利用压缩感知理论将高维的特征降维成为低维的向量,并且采取的是有限大小的矩形框进行采样,大大加快了算法的运行速度。但是当算法跟踪上负样本时,并没有任何补救措施来使算法重新跟踪上目标,这样将限制了FCT算法的跟踪准确率。第4章 算法的改进由于运动的物体在视频中容易有姿态变化、光照变化以及高速移动而造成的运动模糊等情况,所以FCT算法在有些情况下会跟踪上负样本。FCT在追踪上负样本时并没有做任何补救措施。所以本文提出利用SURF算法在一定的帧间隔内对进行目标识别,在FC

41、T运行一定时间后执行该识别算法,使FCT算法能够重新跟踪上目标来提高FCT算法的跟踪准确率,除此以外,也加入了受遮挡处理,当目标受到遮挡时,利用前面几帧的目标位置来预测目标的速度,从而预测目标受遮挡时的位置变化。4.1 基于SURF算法的目标识别SURF算法9也叫加速稳健特征算法是由SIFT算法(尺度不变特征变换算法)改进而来的。和尺度不变特征变换算法不同的是SURF算法的算法运行时间得到有效地减少,使SURF算法在智能监控系统中实时运行成为了可能。要利用SURF算法进行目标识别就得要进行图像特征点的提取以及特征点的匹配。SURF算法利用Hessian矩阵来进行特征点的计算,而使用计算特特征点

42、的欧式距离来判断两个特征点是否匹配。4.1.1 构造Hessian矩阵来提取特征点SURF算法在提取特征点时使用Hessian矩阵作为特征点计算和检测的基础矩阵。Hessian矩阵是SURF的主要部分能够用来找出在图像数据中表现出的边缘点,在进行计算的时候图像的每一个像素都可以创建一个它自己对应的Hessian矩阵。Hessian矩阵在一个具体的像素点X(x,y)在尺度i上的具体定义如下:HX,i=Lxx(X,i)Lxy(X,i)Lxy(X,i)Lyy(X,i)(4-1)Lxx(X,i)代表的是像素点X(x,y)和高斯函数在尺寸i上的x二阶偏导的卷积结果。同理,Lxy(X,i)、Lyy(X,i

43、)代表的是在xy、y的二阶偏导的卷积结果,所以的HX,i的行列式的detH为:detH=Lxx(X,i)Lyy(X,i)-(Lxy(X,i)2(4-2)而在算法实际的计算过程中,我们经常使用矩形滤波的二阶偏导来与像素点X(x,y)卷积得到Dxx,Dxy以及Dyy来替换Lxx(X,i)、Lxy(X,i)以及Lyy(X,i)。为了减少因为这种替换带来的误差引入一个变量,所以detH可以被视为:detH=DxxDxy-(Dxy)2(4-3)文献9中提出的值为0.9时会使计算最为合理。在计算得到一个像素点的行列式后,我们需要将这个特征的行列值和相邻两个不同尺度的9个像素点以及本层尺度的其他8个像素点进

44、行比较,如果在这些像素点中存在极大值或者极小值便把取得极值的点标记为备选特征点。在进行所有的特征点计算后我们拥有许多的备选特征点,而SURF算法会设置一个阈值,只有大于阈值的备选特征点才会成为我们最后真正选择的特征点,这些保留下来的特征点才是在表现得最为强烈的特征点。4.1.2 特征点匹配SURF算法的特征点匹配与SIFT算法的特征点匹配的原理是大致一样的,也就是说SURF算法判断两个特征点是否匹配是通过计算两个特征点的欧式距离。两个特征点的匹配度取决于这两个特征点的欧式距离,欧氏距离越短的两个特征点的匹配程度越高。在计算过程中总是计算每个特征点与匹配图像的所有特征点的欧式距离,然后计算最小值

45、与次小值的比值,若比值小于阈值0.8则暂时认为这个特征点和最小的欧式距离的特征点是匹配的。但是这也存在着和SIFT算法不一致的地方,SURF算法在两个特征点的匹配过程中还涉及到了判断Hessian矩阵的迹的正负号。两个特征点的Hessian矩阵的迹的正负号一样的时候才代表这两个提取的特征点的方向是一致的,如果不是相同的则说明他们的对比度的变化方向是相反的,就算它们的欧氏距离再短也不能说明它们是匹配的特征点,并且直接排除它们是匹配的。而在本文的特征点匹配中使用的是Brute Force Matcher(暴力匹配法),Brute Force Matcher会尝试去把一个点与其他所有点进行匹配,然后

46、使得所有点都能找到自己的最佳匹配。除此之外,也可以使用FLANN算法(Fast Approximate Nearest Neighbor Search Library)进行匹配来实现快速匹配。它是一种最近邻相似的匹配算法,它不必将每个点与其他点进行匹配从而来加快匹配的速度,所以在只需要找到相对好的匹配结果而不是最佳匹配结果才使用FLANN,来加快匹配的运算速度。4.1.3 SURF算法的实现以及实现效果为了更加具体地描述SURF算法的执行效果,本文利用OpenCV2.4.9的函数库来实现SURF算法的特征点提取以及SURF算法特征点的匹配。代码是在基于Windows 10的VS2010的编程环

47、境下运行的,图4-1为SURF算法提取特征点后的两张检测图片, 图4-2为SURF算法进行最优的特征点匹配后的图片,图4-3位根据特征点标记出的匹配后目标位置的图像。在图4-1中,算法提取的是car视频中的第一帧图像以及在car视频中视频跟踪的汽车的图像的特征点。从图中我们可以看出,算法定位的特征点大多是图像像素中的稳定的像素突变点。图4-1 SURF算法提取特征点在图4-2中是两张图像的特征点利用计算欧氏距离匹配后的图像,在完成特征点匹配后根据匹配的特征点标记出第一帧图片中的汽车的位置,如图4-3所示。图4-2 图像特征点的匹配以及目标的定位图4-3 根据特征点标记出汽车的位置4.1.4 结合S

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁