《计算机视觉的发展相关精选文档.ppt》由会员分享,可在线阅读,更多相关《计算机视觉的发展相关精选文档.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计算机视觉的发展相关本讲稿第一页,共二十八页人类视觉的目的人类视觉的目的J J Gibson J J Gibson 理论理论 1:1:适应外界环境适应外界环境2 2:控制自身的运动:控制自身的运动D Marr:D Marr:重构可见表面的几何形状重构可见表面的几何形状形状形状位置位置运动运动 整体感知:不可计算可计算本讲稿第二页,共二十八页计算机视觉的任务计算机视觉的任务l中心任务就是对图象进行理解中心任务就是对图象进行理解对单幅图象的理解对单幅图象的理解对多幅图象的理解对多幅图象的理解对视频图象的理解对视频图象的理解21世纪,是对video图象进行理解的世纪理解什么?理解什么?形状,位置、运
2、动形状,位置、运动本讲稿第三页,共二十八页人类视觉人类视觉计算机视觉计算机视觉认认知知和和感感知知理理论论或或模模型型只只有有可可计计算算才才能能对对计计算算机机视视觉觉研研究究有有推推动动作作用用本讲稿第四页,共二十八页历史与现状历史与现状计算机视觉计算机视觉20多年来的二大事件多年来的二大事件主主动动视视觉觉,目目的的视视觉觉Marr计算视觉理论计算视觉理论(80年代)年代)使计算机视觉成为一门独立科学使计算机视觉成为一门独立科学摄象机自标定和分层重建(摄象机自标定和分层重建(90年代)年代)使计算机视觉走出了低谷使计算机视觉走出了低谷本讲稿第五页,共二十八页MarrMarr计算计算视觉理
3、论视觉理论MarrMarr计算视觉理论有二个核心论点:计算视觉理论有二个核心论点:1 1:人类视觉的主体是:人类视觉的主体是重构可见表面重构可见表面的几何的几何形状;形状;2 2:人类视觉的重构过程是可以通过:人类视觉的重构过程是可以通过计算的计算的方式方式完成的。完成的。本讲稿第六页,共二十八页Random-dot stereograms Bela Julesz in 1960病理学证据病理学证据本讲稿第七页,共二十八页MarrMarr计算计算视觉理论视觉理论三个层次三个层次计算理论计算理论表达与算法表达与算法算法实现算法实现三个步骤三个步骤Primitives2.5 D 3D 本讲稿第八页
4、,共二十八页算法的三个步骤算法的三个步骤图像图像Zero-crossingRaw primal sketchFull primal sketch立体视觉立体视觉运动分析运动分析轮廓分析轮廓分析光照分析光照分析表达表达3D3D物体物体识别识别物体物体种类种类形状形状位置位置的描的描述述本讲稿第九页,共二十八页人类立体视觉模块人类立体视觉模块l尽管人们对尽管人们对MarrMarr计算视觉理论提出了这计算视觉理论提出了这样那样的质疑和批评,但样那样的质疑和批评,但MarrMarr计算视觉计算视觉仍然是计算机视觉的主流理论。仍然是计算机视觉的主流理论。l也许也许MarrMarr的的“视觉主体为对可见表
5、面的视觉主体为对可见表面的重构重构”假设是错误的,但人类的立体视假设是错误的,但人类的立体视觉通道是最主要的通道之一。觉通道是最主要的通道之一。本讲稿第十页,共二十八页人类视觉通道人类视觉通道本讲稿第十一页,共二十八页计算机视觉的发展历程计算机视觉的发展历程1982198819932004工业应用,工业应用,精度要求高精度要求高精度要求不精度要求不高的应用高的应用?本讲稿第十二页,共二十八页9292年以来最大的理论成果年以来最大的理论成果分层重构理论分层重构理论图图象象图象图象射影空间射影空间仿射空间仿射空间欧氏空间欧氏空间欧氏空间欧氏空间本讲稿第十三页,共二十八页认知心理学实验支持分层重构认
6、知心理学实验支持分层重构理论理论优先级别优先级别拓拓扑扑空空间间射射影影空空间间仿仿射射空空间间欧欧氏氏空空间间本讲稿第十四页,共二十八页不同空间下重建的定义不同空间下重建的定义如果则则当A为射影变换矩阵射影变换矩阵时,称此时的重建为射影重建射影重建当A为仿射变换矩阵仿射变换矩阵时,称此时的重建为仿射重建仿射重建当A为刚体变换矩阵刚体变换矩阵时,称此时的重建为欧氏重建欧氏重建PEXE本讲稿第十五页,共二十八页X,PUPE,XE 欧氏空间欧氏空间欧氏变换欧氏重建射影变换射影重建仿射变换仿射重建本讲稿第十六页,共二十八页本讲稿第十七页,共二十八页本讲稿第十八页,共二十八页本讲稿第十九页,共二十八页
7、计算机视觉的几个核心问题计算机视觉的几个核心问题 单幅图象单幅图象分割问题分割问题多幅图象多幅图象三维重构问题三维重构问题运动分割与跟踪运动分割与跟踪本讲稿第二十页,共二十八页 与心理学、神经解剖学、生物物理学结合,与心理学、神经解剖学、生物物理学结合,解决计算机视觉的核心问题解决计算机视觉的核心问题 可计可计算性算性三维重构三维重构运动分析运动分析运动分割运动分割物体跟踪物体跟踪对应问题对应问题重构理论重构理论值得研究的主要方向值得研究的主要方向本讲稿第二十一页,共二十八页当前的研究热点当前的研究热点视视觉觉监监视视运动问题运动问题重构问题重构问题最终目标最终目标General vision
8、 system本讲稿第二十二页,共二十八页计算机视觉的主要机构,代表人物计算机视觉的主要机构,代表人物O.Faugeras,B.Triggs:INRIAA.Zisserman,Oxford U.L.Van Gool,M.Poleffeys:Leuven U.R.Hartley,AustraliaY.Ma,Illinois U.本讲稿第二十三页,共二十八页分割不是一个分割不是一个well-posed 问题问题 我们能从图象中分割出一个红把手的白我们能从图象中分割出一个红把手的白茶杯吗?茶杯吗?本讲稿第二十四页,共二十八页基于内容的图象检索不是一个基于内容的图象检索不是一个well-posed w
9、ell-posed 问题问题形状的相似性形状的相似性图象图象内容内容在射影空间如何度量在射影空间如何度量形状的相似性?形状的相似性?本讲稿第二十五页,共二十八页重构问题的三个主要步骤重构问题的三个主要步骤Correspondence,Camera Calibration,Motion decomposition本讲稿第二十六页,共二十八页鲁棒性问题鲁棒性问题 计算机视觉的根本问题是一个鲁棒性问计算机视觉的根本问题是一个鲁棒性问题,如果不考虑鲁棒性问题的话,计算题,如果不考虑鲁棒性问题的话,计算机视觉几乎所有问题都解决了机视觉几乎所有问题都解决了R.Harallick R.Harallick 前前IEEE Trans.PAMI IEEE Trans.PAMI 主编,主编,IAPR IAPR 主席主席本讲稿第二十七页,共二十八页Questions!本讲稿第二十八页,共二十八页