计算机视觉发展史精选PPT.ppt

上传人:石*** 文档编号:43304899 上传时间:2022-09-17 格式:PPT 页数:41 大小:2.98MB
返回 下载 相关 举报
计算机视觉发展史精选PPT.ppt_第1页
第1页 / 共41页
计算机视觉发展史精选PPT.ppt_第2页
第2页 / 共41页
点击查看更多>>
资源描述

《计算机视觉发展史精选PPT.ppt》由会员分享,可在线阅读,更多相关《计算机视觉发展史精选PPT.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、计算机视觉发展史第1页,此课件共41页哦17 17 九月九月 2022 20222 2参考教材:参考教材:贾云得贾云得 机器视觉机器视觉科学出版社,科学出版社,2000参考书目:参考书目:1、图像处理、分析与机器视觉图像处理、分析与机器视觉(第二版)(第二版)M.Sonka,V.Hlavac,R.Boyle著,艾海舟等译,著,艾海舟等译,人民邮电出版社,人民邮电出版社,20032、机器视觉教程机器视觉教程W.E.Snyder,H.Qi著著 林学訚等译,机械工业出版社,林学訚等译,机械工业出版社,20053、计算机视觉计算机视觉马颂德著,科学出版社,马颂德著,科学出版社,1999课程教材课程教材

2、第2页,此课件共41页哦17 17 九月九月 2022 20223 31.引言引言 智能机器智能机器:能模拟人类的功能,能感知外部世界并有效地解决能模拟人类的功能,能感知外部世界并有效地解决人所能解决问题人所能解决问题感知系统感知系统:人类感知外部世界主要是通过视觉、触觉、听觉:人类感知外部世界主要是通过视觉、触觉、听觉和嗅觉等感觉器官,其中约和嗅觉等感觉器官,其中约80%80%的信息是由视觉获取的因的信息是由视觉获取的因此此,对于智能机器来说,赋予机器以人类视觉功能对发展智能机对于智能机器来说,赋予机器以人类视觉功能对发展智能机器是及其重要的,也由此形成了一门新的学科器是及其重要的,也由此形

3、成了一门新的学科计算机视觉计算机视觉(也称机器视觉或图像分析与理解等也称机器视觉或图像分析与理解等)计算机视觉的发展不仅将大计算机视觉的发展不仅将大大推动智能系统的发展,也将拓宽计算机与各种智能机器的研大推动智能系统的发展,也将拓宽计算机与各种智能机器的研究范围和应用领域究范围和应用领域 计算机视觉计算机视觉:研究用计算机来模拟生物视觉功能的科学和技术:研究用计算机来模拟生物视觉功能的科学和技术计算机视觉系统的首要目标是用图像创建或恢复现实世界模型,计算机视觉系统的首要目标是用图像创建或恢复现实世界模型,然后认知现实世界然后认知现实世界第3页,此课件共41页哦17 17 九月九月 2022 2

4、0224 4 2020世纪世纪5050年代年代归入模式识别归入模式识别-主要集中在二维图像分析和识别上,主要集中在二维图像分析和识别上,如,光学字符识别,工件表面、显微图片和航空图片的分析和解如,光学字符识别,工件表面、显微图片和航空图片的分析和解释等释等6060年代年代MIT MIT 的的RobertsRoberts通过计算机程序从数字图像中提取出诸如立方体、通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述行描述Roberts Roberts 的研究工作开创了以理

5、解三维场景为目的的三维的研究工作开创了以理解三维场景为目的的三维计算机视觉的研究计算机视觉的研究RobertsRoberts对积木世界的创造性研究给人们以极大的对积木世界的创造性研究给人们以极大的启发,许多人相信,一旦由白色积木玩具组成的三维世界可以被理解,启发,许多人相信,一旦由白色积木玩具组成的三维世界可以被理解,则可以推广到理解更复杂的三维场景则可以推广到理解更复杂的三维场景7070年代年代,已经出现了一些视觉应用系统,已经出现了一些视觉应用系统7070年代中期,麻省理工学院年代中期,麻省理工学院(MIT)(MIT)人工智能人工智能(AI)(AI)实验室正式开设实验室正式开设“计算机视觉

6、计算机视觉”(Machine Vision)(Machine Vision)课程,课程,由由B BK KP PHornHorn教授讲授教授讲授2.计算机视觉发展第4页,此课件共41页哦17 17 九月九月 2022 20225 5MIT AI 实验室吸引了国际上许多知名学者参与计算机视觉的理论、算法、系统设计的研究,David Marr教授就是其中的一位他于1973年应邀在MIT AI 实验室领导一个以博士生为主体的研究小组,1977年提出了不同于“积木世界”分析方法的计算视觉理论(computational vision),该理论在80年代成为计算机视觉研究领域中的一个十分重要的理论框架第5

7、页,此课件共41页哦17 17 九月九月 2022 20226 6研究热潮是从 20世纪80年代开始的,到了80年代中期,计算机视觉获得了蓬勃发展,新概念、新方法、新理论不断涌现,比如,基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等Marr的计算理论第6页,此课件共41页哦17 17 九月九月 2022 20227 7许多会议论文集都反应了该领域的最新进展,比如:Int.Conf.on Computer Vision and Pattern Recognition(CVPR);Int.Conf.on Computer Vision(ICCV);Int.Conf.on P

8、attern Recognition(ICPR);Int.Conf.on Robotics and Automation(ICRA);Workshop on Computer Vision,SPIE还有许多学术期刊也包含了这一领域的最新研究成果,如:IEEE Trans.on Pattern Analysis and Machine Intelligence(PAMI);Computer Vision,Graphics,and Image Processing(CVGIP);IEEE Trans.on Image Processing;IEEE Trans.on Systems,Man,and

9、 Cybernetics(SMC);Machine Vision and Applications;Int.J on Computer Vision(IJCV);Image and Vision Computing;Pattern Recognition第7页,此课件共41页哦17 17 九月九月 2022 20228 83.Marr的视觉计算理论Marr Marr 的视觉计算理论的视觉计算理论Marr1982Marr1982立足于计算机科学,系统地概括立足于计算机科学,系统地概括了心理生理学、神经生理学等方面取得的所有重要成果,是视觉了心理生理学、神经生理学等方面取得的所有重要成果,是视觉研

10、究中迄今为止最为完善的视觉理论研究中迄今为止最为完善的视觉理论 Marr Marr 建立的视觉计算理论,建立的视觉计算理论,使计算机视觉研究有了一个比较明确的体系,并大大推动了计算机视觉使计算机视觉研究有了一个比较明确的体系,并大大推动了计算机视觉研究的发展人们普遍认为,计算机视觉这门学科的形成与研究的发展人们普遍认为,计算机视觉这门学科的形成与MarrMarr的视的视觉理论有着密切的关系觉理论有着密切的关系第8页,此课件共41页哦17 17 九月九月 2022 20229 9 3.1 信息处理三个层次信息处理三个层次第9页,此课件共41页哦17 17 九月九月 2022 202210103.

11、2 视觉表示框架视觉表示框架第一阶段第一阶段(也称为早期阶段也称为早期阶段)是将输入的原始图像进行处理,抽取图是将输入的原始图像进行处理,抽取图像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图集合称为基元图(primitive sketch)(primitive sketch);第二阶段第二阶段(中期阶段中期阶段)是指在以观测者为中心的坐标系中,由输入图像是指在以观测者为中心的坐标系中,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息的

12、包含了深度信息,但不是真正的物体三维表示,因此,称为二维的包含了深度信息,但不是真正的物体三维表示,因此,称为二维半图半图(2(25 dimensional sketch)5 dimensional sketch);第三阶段第三阶段(后期阶段后期阶段)是在以物体为中心的坐标系中,由输入图是在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体。像、基元图、二维半图来恢复、表示和识别三维物体。第10页,此课件共41页哦17 17 九月九月 2022 20221111表1-2 由图像恢复形状信息的表示框架名 称目 的基 元图像光强表示图像中每一点的强度值基元图表示二维图像

13、中的重要信息,主要是图像中的强度变化位置及其几何分布和组织结构零交叉,斑点,端点和不连续点,边缘片断,有效线段,组合群,曲线组织,边界 25维图在以观测者为中心的坐标系中,表示可见表面的方向、深度值和不连续的轮廓局部表面朝向(“针”基元)离观测者的距离深度上的不连续点表面朝向的不连续点3维模型表示在以物体为中心的坐标系中,用由体积基元和面积基元构成的模块化多层次表示,描述形状及其空间组织形式分层次组成若干三维模型,每个三维模型都是在几个轴线空间的基础上构成的,所有体积基元或面积形状基元都附着在轴线上第11页,此课件共41页哦17 17 九月九月 2022 20221212MarrMarr理论是

14、计算机视觉研究领域的划时代成就,但该理论不理论是计算机视觉研究领域的划时代成就,但该理论不是十分完善的,许多方面还有争议比如是十分完善的,许多方面还有争议比如:视觉处理框架基本上是自下而上,没有反馈视觉处理框架基本上是自下而上,没有反馈;没有足够地重视知识的应用没有足够地重视知识的应用MarrMarr理论给了我们研究计算机视觉许多珍贵的哲学思想理论给了我们研究计算机视觉许多珍贵的哲学思想和研究方法,同时也给计算机视觉研究领域创造了许多和研究方法,同时也给计算机视觉研究领域创造了许多研究起点。研究起点。3.3 Marr 视觉理论的不足视觉理论的不足第12页,此课件共41页哦17 17 九月九月

15、2022 20221313第13页,此课件共41页哦17 17 九月九月 2022 202214144.计算机视觉的应用计算机视觉的应用 零件识别与定位零件识别与定位 (工业生产线)(工业生产线)产品检验产品检验 (纺织工业棉花质量检验)(纺织工业棉花质量检验)移动机器人导航(星球机器人)移动机器人导航(星球机器人)遥感图像分析(植被分析)遥感图像分析(植被分析)医学图像分析(骨骼定位)医学图像分析(骨骼定位)安全鉴别、监视与跟踪(门禁系统)安全鉴别、监视与跟踪(门禁系统)国防系统(目标自动识别国防系统(目标自动识别ATRATR与目标跟踪)与目标跟踪)其它(动画、体育、考古)其它(动画、体育、

16、考古)第14页,此课件共41页哦17 17 九月九月 2022 20221515Sojourner 火星车前部图,中部的两个小突出是两个黑白CCD摄像机第15页,此课件共41页哦17 17 九月九月 2022 20221616第16页,此课件共41页哦17 17 九月九月 2022 20221717Rocky 7 火星机器人第17页,此课件共41页哦17 17 九月九月 2022 20221818第18页,此课件共41页哦17 17 九月九月 2022 20221919 Rocky7视觉系统获取的立体图象对障碍物探测示意图Rocky7 视觉系统对场景的深度恢复 第19页,此课件共41页哦17

17、17 九月九月 2022 20222020CMU月球探测实验车Nomad漫游者第20页,此课件共41页哦17 17 九月九月 2022 20222121月球探测实验车Nomad漫游者第21页,此课件共41页哦17 17 九月九月 2022 20222222昆虫机器人足球机器人足球机器人第22页,此课件共41页哦17 17 九月九月 2022 20222323日本 Honda 仿人机器人第23页,此课件共41页哦17 17 九月九月 2022 20222424具有立体视觉的机器人第24页,此课件共41页哦17 17 九月九月 2022 20222525人头部跟踪演示第25页,此课件共41页哦17

18、 17 九月九月 2022 20222626MIT Media Lab ,与虚拟生物交互演示第26页,此课件共41页哦17 17 九月九月 2022 20222727基于恢复图象序列的五角大楼三维重建第27页,此课件共41页哦17 17 九月九月 2022 20222828基于图象序列的三维人脸恢复第28页,此课件共41页哦17 17 九月九月 2022 20222929视觉系统坐标系视觉系统坐标系n像素坐标:像素坐标:表示图像阵列中图像像素的位置;n图像平面坐标:图像平面坐标:表示场景点在图像平面上的投 影;n摄象机坐标:摄象机坐标:即以观察者为中心的坐标,将场 景点表示成以观察者为中心的数

19、据形式n场景坐标:场景坐标:也称作绝对坐标(或世界坐标),用于 表示场景点的绝对坐标;第29页,此课件共41页哦17 17 九月九月 2022 202230305.计算机视觉的研究内容计算机视觉的研究内容一、输入设备(input device)包括成像设备和数字化包括成像设备和数字化设备成象设备是指通过光学摄像机或红外、激光、超声、设备成象设备是指通过光学摄像机或红外、激光、超声、X X射线对周围场景或物体进行探测成象,得到关于场景或物射线对周围场景或物体进行探测成象,得到关于场景或物体的二维或三维数字化图像体的二维或三维数字化图像二、低层视觉(low level)主主要要是是对对输输入入的的

20、原原始始图图像像进进行行处处理理这这一一过过程程借借用用了了大大量量的的图图像像处处理理技技术术和和算算法法,如如图图像像滤滤波波、图图像像增增强强、边边缘缘检检测测等等,以以便便从从图图像像中中抽抽取取诸诸如如角角点点、边边缘缘、线线条条、边边界界以以及及色色彩彩等等关关于于场场景景的的基基本本特特征征;这这一一过过程程还还包包含含了了各各种种图图像像变变换换(如如校校正正)、图像纹理检测、图像运动检测等图像纹理检测、图像运动检测等第30页,此课件共41页哦17 17 九月九月 2022 20223131三、中层视觉(middle level)主主要要任任务务是是恢恢复复场场景景的的深深度度

21、、表表面面法法线线方方向向、轮轮廓廓等等有有关关场场景景的的2 25 5维维信信息息,实实现现的的途途径径有有立立体体视视觉觉(stereo stereo visionvision)、测测距距成成像像(rangefinderrangefinder)运运动动估估计计(motion motion estimationestimation)、明明暗暗特特征征、纹纹理理特特征征等等.系系统统标标定定、系系统统成像模型等研究内容一般也是在这个层次上进行的成像模型等研究内容一般也是在这个层次上进行的四、高层视觉(high level)主要任务是在以物体为中主要任务是在以物体为中心的坐标系中,在原始输入图像

22、、图像基本特征、心的坐标系中,在原始输入图像、图像基本特征、2 25 5维图的基维图的基础上,恢复物体的完整三维图,建立物体三维描述,识别三础上,恢复物体的完整三维图,建立物体三维描述,识别三维物体并确定物体的位置和方向维物体并确定物体的位置和方向第31页,此课件共41页哦17 17 九月九月 2022 202232326.计算机视觉研究面临的困难计算机视觉研究面临的困难(1 1)图像多义性:图像多义性:三维场景被投影为二维图像,深度和不可三维场景被投影为二维图像,深度和不可见部分的信息被丢失,因而会出现不同形状的三维物体投影在见部分的信息被丢失,因而会出现不同形状的三维物体投影在图像平面上产

23、生相同图像的问题另外,在不同角度获取同一图像平面上产生相同图像的问题另外,在不同角度获取同一物体的图像会有很大的差异物体的图像会有很大的差异(2 2)环境因素影响:场景中的诸多因素,包括照明、物体形状、表)环境因素影响:场景中的诸多因素,包括照明、物体形状、表面颜色、摄像机以及空间关系变化都会对成像有影响,面颜色、摄像机以及空间关系变化都会对成像有影响,(3 3)知识导引:)知识导引:同样的图像在不同的知识导引下,将会产生同样的图像在不同的知识导引下,将会产生不同的识别结果不同的识别结果(4 4)大量数据:)大量数据:灰度图像,彩色图像,深度图像的信息量十分巨大,灰度图像,彩色图像,深度图像的

24、信息量十分巨大,巨大的数据量需要很大的存贮空间,同时不易实现快速处理巨大的数据量需要很大的存贮空间,同时不易实现快速处理第32页,此课件共41页哦17 17 九月九月 2022 202233337.计算机视觉与其它学科领域的关系计算机视觉与其它学科领域的关系(1 1)图像处理图像处理:图像处理通常是把一幅图像变换成另外一幅图像,:图像处理通常是把一幅图像变换成另外一幅图像,也就是说,图像处理系统的输入是图像,输出仍然是图像,信息恢复也就是说,图像处理系统的输入是图像,输出仍然是图像,信息恢复任务则留给人来完成任务则留给人来完成(2 2)计算机图形学计算机图形学:通过几何基元,如线、圆和自由曲面

25、,来:通过几何基元,如线、圆和自由曲面,来生成图像,它在可视化(生成图像,它在可视化(VisualizationVisualization)和虚拟现实)和虚拟现实(Virtual Reality(Virtual Reality)中起着很重要的作用计算机视觉正好是解决相反的问题,即)中起着很重要的作用计算机视觉正好是解决相反的问题,即从图像中估计几何基元和其它特征因此,计算机图形学属于图从图像中估计几何基元和其它特征因此,计算机图形学属于图像综合,计算机视觉属于图像分析像综合,计算机视觉属于图像分析(3 3)模式识别:模式识别:用于识别各种符号、图画等平面图形用于识别各种符号、图画等平面图形模式

26、一般指一模式一般指一类事物区别于其它事物所具有的共同特征。模式识别方法有统计方法类事物区别于其它事物所具有的共同特征。模式识别方法有统计方法和句法方法两种,统计方法是指从模式抽取一组特征值,并以划分特和句法方法两种,统计方法是指从模式抽取一组特征值,并以划分特征空间的方法来识别每一个模式征空间的方法来识别每一个模式第33页,此课件共41页哦17 17 九月九月 2022 20223434(4 4)人人工工智智能能(AIAI):涉涉及及到到智智能能系系统统的的设设计计和和智智能能计计算算的的研研究究在在经经过过图图像像处处理理和和图图像像特特征征提提取取过过程程后后,接接下下来来要要用用人人工工

27、智智能能方方法法对对场场景景特特征征进进行行表表示示,并并分分析析和和理理解解场场景景人人工工智智能能有有三三个个过过程程:感感知知、认认知知和行动和行动(5 5)人人工工神神经经网网络络(ANNsANNs):是是一一种种信信息息处处理理系系统统,它它是是由由大大量量简简单单的的处处理理单单元元(称称为为神神经经元元)通通过过具具有有强强度度的的连连接接相相互互联联系系起起来来,实实现现并并行行分分布布式式处处理理(PDPPDP)人人工工神神经经网网络络的的最最大大特特点点是是可可以以通通过过改改变变连连接接强强度度来来调调整整系系统统,使使之之适适应应复复杂杂的的环环境境,实实现现类类似似人

28、人的的学学习、归纳和分类等功能习、归纳和分类等功能(6 6)神神经经物物理理学学与与认认知知科科学学:将将人人类类视视觉觉作作为为主主要要的的研研究究对对象象计计算算机机视视觉觉中中已已有有的的许许多多方方法法与与人人类类视视觉觉极极为为相相似似许许多多计计算算机机视视觉觉研研究究者者对对研研究究人人类类视视觉觉计计算算模模型型比比研研究究计计算算机机视视觉觉系系统统更更感感兴兴趣趣,希希望望计计算算机机视觉更加自然化,更加接近生物视觉视觉更加自然化,更加接近生物视觉第34页,此课件共41页哦17 17 九月九月 2022 202235358.计算机视觉研究对策计算机视觉研究对策 研究人员不断

29、寻求新的途径和手段,比如,主动视觉研究人员不断寻求新的途径和手段,比如,主动视觉(active(active vision)vision),面向任务的视觉,面向任务的视觉(task-oriented vision)(task-oriented vision),基于知识、基于模型,基于知识、基于模型的视觉,以及多传感融合和集成视觉等方法,其中人们越来越的视觉,以及多传感融合和集成视觉等方法,其中人们越来越重视对知识的应用我们会看到,计算机视觉系统的最大特征重视对知识的应用我们会看到,计算机视觉系统的最大特征是,在视觉的各个阶段,系统尽可能地进行自动运算为此,是,在视觉的各个阶段,系统尽可能地进行

30、自动运算为此,系统需要使用各种知识,包括特征模型、成像过程、物体模型系统需要使用各种知识,包括特征模型、成像过程、物体模型和物体间的关系如果计算机视觉系统不用这些知识,则其应和物体间的关系如果计算机视觉系统不用这些知识,则其应用的范围及其功能将十分有限因此,视觉系统应该使用那些用的范围及其功能将十分有限因此,视觉系统应该使用那些可以被明确表示的知识,以使系统具有更高的适应性和鲁棒性可以被明确表示的知识,以使系统具有更高的适应性和鲁棒性合理地使用知识不仅可以有效地提高系统的适应性和鲁棒性,合理地使用知识不仅可以有效地提高系统的适应性和鲁棒性,而且可以求解计算机视觉中较难的问题而且可以求解计算机视

31、觉中较难的问题第35页,此课件共41页哦17 17 九月九月 2022 202236361基于视觉感知与认知机理的图像分析与识别系统基于视觉感知与认知机理的图像分析与识别系统研究目标:突破基于人类视觉感知与认知机理的图像处理模型、关键技术和算法,建立个性化、高准确度的图像分析 与识别系统。研究内容:分层交互的统计视觉计算模型与推理,基于感知整 合机制的视觉模式识别技术,具有选择性注意机制的 视觉信息搜索与多目标跟踪模型。863计划信息技术领域计划信息技术领域2006年度专题课题申请指南年度专题课题申请指南目标导向类课题目标导向类课题:第36页,此课件共41页哦17 17 九月九月 2022 2

32、02237372复杂应用环境下的生物特征识别系统复杂应用环境下的生物特征识别系统研究目标:突破安全便捷的、高可靠性的多生物特征获取及识 别算法,建立面向典型应用的生物特征识别与认证原 型系统。研究内容:脸相、虹膜、掌纹等多生物特征获取技术,大规模 生物特征库的分类和检索,具有鲁棒性的生物特征识 别关键技术,面向实际应用需求的多种生物特征的融 合技术等。863计划信息技术领域计划信息技术领域2006年度专题课题申请指南年度专题课题申请指南目标导向类课题目标导向类课题:第37页,此课件共41页哦17 17 九月九月 2022 20223838图16 透视投影倒立成像几何示意图 透视投影透视投影第3

33、8页,此课件共41页哦17 17 九月九月 2022 20223939图17 透视投影几何示意图 第39页,此课件共41页哦17 17 九月九月 2022 20224040图 18 正交投影几何示意图正交投影正交投影第40页,此课件共41页哦17 17 九月九月 2022 20224141视觉系统坐标系视觉系统坐标系n像素坐标:像素坐标:表示图像阵列中图像像素的位置;n图像平面坐标:图像平面坐标:表示场景点在图像平面上的投 影;n摄象机坐标:摄象机坐标:即以观察者为中心的坐标,将场 景点表示成以观察者为中心的数据形式n场景坐标:场景坐标:也称作绝对坐标(或世界坐标),用于 表示场景点的绝对坐标;第41页,此课件共41页哦

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁