《现代图像分析知识点 (51).pdf》由会员分享,可在线阅读,更多相关《现代图像分析知识点 (51).pdf(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Modern Image Analysis 词袋模型 BOW(Bag-of-Words)Bag-of-Words模型是信息检索领域常用的文档表示方法。在信息检索中BOW模型假定对于一个文档,忽略它的单词顺序和语法、句法等要素,将其仅仅看做是若干个词汇的集合,文档中每个单词的出现都是独立的,不依赖于其他单词是否出现。8.5 流行的局部特征描述子 8.5 流行的局部特征描述子 BOWModern Image Analysis例如有如下两个文档:(1)Bob likes to play basketball,Jim likes too.(2)Bob also likes to play footba
2、ll games.基于这两个文本文档,构建一个单词表:Vocabulary=1.“Bob”,2.“likes”,3.“to”,4.“play”5.“basketball”,6.“also”7.“football”8.“games”9.“Jim”,10.“too”D=1,2,3,4,5,6,7,8,9,10(1)1,2,1,1,1,0,0,0,1,1(2)1,1,1,1,0,1,1,1,0,08.5 流行的局部特征描述子 8.5 流行的局部特征描述子 BOWModern Image Analysis用单词直方图表示05w1w2w3w4w5w6w7w8w9w10文档文档10123w1w2w3w4w
3、5w6w7w8w9w10文档文档28.5 流行的局部特征描述子 8.5 流行的局部特征描述子 BOWModern Image AnalysisBag-of-Words 实现步骤:(1)单词表的建立:大数据聚类,找到合适的聚类中心点。(2)样本的训练:对每个文档进行训练,得到每个文档的低维表示。(3)新来样本的识别:对新来的样本先用单词表得到低维表示,用分类器进行预测。8.5 流行的局部特征描述子 8.5 流行的局部特征描述子 BOWModern Image AnalysisBag-of-visual-Words与文本文档进行类比8.5 流行的局部特征描述子 8.5 流行的局部特征描述子 BOW
4、Modern Image Analysis目标Bag of words将BOW模型应用于图像表示8.5 流行的局部特征描述子 8.5 流行的局部特征描述子 BOWModern Image Analysis图像中的单词不像文本文档中的那样是现成的,我们需要先从图像中提取出相互独立的视觉单词,这通常需要经过三个步骤:(1)特征检测(2)特征表示(3)词汇表的生成从图像中提取的相互独立的视觉单词8.5 流行的局部特征描述子 8.5 流行的局部特征描述子 BOWModern Image AnalysisSIFT算法是提取图像中局部不变特征应用最广泛的算法,可以用SIFT算法从图像中提取不变特征点,作为
5、视觉单词,并构造单词表,用单词表中的单词表示一幅图像。举例:(1)利用SIFT算法,从每类图像中提取视觉单词,将所有的视觉单词集合在一起。假如有三张训练图片,对于每张训练图片进行特征点检测,每个特征点提取128维的SIFT特征。(2)利用K-means算法构造单词表8.5 流行的局部特征描述子 8.5 流行的局部特征描述子 BOWModern Image AnalysisSIFT 提取的视觉单词K-means算法K-means算法将特征向量聚类为4个8.5 流行的局部特征描述子 8.5 流行的局部特征描述子 BOWModern Image Analysis(2)利用视觉词袋量化图像特征,利用词频表示图像人脸:3,30,3,20 自行车:20,3,3,2 吉他:8,12,32,78.5 流行的局部特征描述子 8.5 流行的局部特征描述子 BOW