《基于SVM的图像分类系统设计文档成勇论文毕业文章_论文-毕业文章.pdf》由会员分享,可在线阅读,更多相关《基于SVM的图像分类系统设计文档成勇论文毕业文章_论文-毕业文章.pdf(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 LANZHOU UNIVERSITY OF TECHNOLOGY 毕 业 设 计 题 目 基 于SVM 图 象 分 类 系 统 学生姓名 成 勇 学 号 专业班级 计算机科学及技术 3 班 指导教师 李晓旭 学 院 计算机及通信学院 答辩日期 I/36 摘 要 支持向量机(SVM)方法是建立在统计学习理论基础之上,克服了神经网络分类和传统统计分类方法许多缺点,具有较高泛化性能。但是,由于支持向量机尚处在发展阶段,很多方面尚不完善,现有成果多局限于理论分析,而应用显得较薄弱,因此研究和完善利用支持向量机进行图像分类对进一步推进支持向量机在图像分析领域应用具有积极推动作用。本文通过支持向量机技术
2、和图像特征提取技术实现了一个图像分类实验系统。文中首先引入了支持向量机概念,对支持向量机做了较全面介绍;然后,讨论了图像特征描述和提取方法,对图像颜色矩特征做了详细描述,对 svm 分类也做了详细说明;最后讨论了由分类结果所表现一些问题。测试结果表明,利用图像颜色矩特征分类方法是可行,并且推断出采用综合特征方法比采用单一特征方法进行分类得到结果要更令人满意。关键词:支持向量机 图像分类 特征提取 颜色矩 Abstract The support vector machine(SVM)method is based on statistical learning theory foundatio
3、n,overcome the neural network classification 信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言
4、本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务II/36 and traditional statistical classification method of faults,and has high generalization performance.But,because the support vector machine(SVM)is still in the development stage,many still not perfect,the existing results more limited to the theor
5、etical analysis,and the use of appear more weak and therefore study and improve the use of support vector machines to image classification support vector machine to further advance in the application of image analysis play a positive role in promoting.In this paper,support vector machine(SVM)technol
6、ogy and image feature extraction technology implements a image classification experiment system.This paper first introduces the concept of support vector machine(SVM),the support vector machine(SVM)made a more comprehensive introduction;Then,discussed the image characteristics of description and ext
7、raction method,the image color moment features described in detail,also made detailed instructions for the SVM classification;Finally discussed the classification results of some problems.Test results show that using the torque characteristics of the image color classification method is feasible,and
8、 deduce the comprehensive characteristic method than using single feature method to classify the results are more satisfactory.Keywords:support vector machine image classification feature extraction Color Moment 信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果
9、多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务1/36 目 录 摘 要.I Abstract.I 第一章 前言.1 1.1 本课题研究意义.1 1.2 本论文目、内容.1 1.3 开发技术介绍.1 1.3.1 SVM
10、技术及其发展简史.1 1.3.2 java技术简介.2 第二章 系统分析.3 2.1 系统需求分析.3 2.2 系统业务流程分析.3 第三章 系统总体设计.4 3.1 分类系统结构.4 3.2 图像数据库.4 3.3 特征提取模块.4 3.4 svm 分类模块.4 第四章 系统详细设计.6 4.1 特征提取模块.6 4.1.1 颜色矩.6 4.2 SVM 分类模块.7 4.2.1 svm算法简介.7 信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应
11、用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务2/36 4.2.2 svm核函数选择.8 4.2.3 svm核函数.8 4.2.4 svmtrain用法.8 4.2.5 svmpredict用法.9 第五章 系统测试.11 5.1 图像
12、数据.11 5.2 提取颜色矩特征.11 5.3 svm 分类.12 5.4 测试结果分析.13 第六章 软件使用说明书.15 设计总结.17 参考文献.18 外文翻译.19 原文.19 Abstract.19 1 Introduction.19 2 Support vector machines.20 3 Co-SVM.21 3.1 Two-view scheme.21 3.2 Multi-view scheme.21 3.3 About SVM.22 4 Related works.24 信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺
13、点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务3/36 译文.25 摘 要.25 1 前 言.25 2 支持向量机.25 3 合作支持向量机.
14、26 3.1 双试图计划.26 3.2 多视图计划.26 3.3 SVM 简介.27 4 相关作品.28 致 谢.30 信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特
15、征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务1/36 第一章 前言 1.1 本课题研究意义 随着信息社会到来,人们越来越多接触到大量图像信息。每天都有大量图像信息在不断产生(如卫星、地质、医疗、安全等领域),这些图像信息有效组织和快速准确分类便成了人们亟待解决课题。图像分类就是利用计算机对图像进行定量分析,把图像中每个像元或区域划归为若干类别中一种,以代替人视觉判读,图像分类过程就是模式识别过程,是目视判读延续和发展。是工业和学术界热点问题。本文提出了一种利用支持向量机(SupportVector Machine
16、,简称 SVM)图像分类方法。该系统可用于各类图像分类,给定某类图像训练数据,可以学习分类规则。对于给定新图像,即能输出图像类别。1.2 本论文目、内容 首先应该指出是,在某些方面,SVM同神经网络研究方法是可以相互借鉴。正如在对神经网络研究一样,人们在 SVM研究方面不能抱有矛盾幻想,一方面想使其功能强大无比,任何情况下都具有极高泛化能力;另一方面,又要求 SVM具有良好性能,例如全局收敛且收敛速度快。这显然是不现实,它应该是人们不断为之奋斗目标。因此在 SVM研究方面必须有所侧重,本文在 SVM研究中偏向于它性能和应用性,即要求保证全局最优基础上,尽量提高收敛速度,使其在图像分析中发挥很好
17、作用:而对 SVM容量控制等理论问题,本文暂不过多涉及。本文对以下问题做了研究:1。分析 SVM模型中核函数特性,探讨核函数及 SVM分类器性能关系,为下面研究做铺垫。2利用上述分析,研究了图像特征对 SVM分类器影响,主要利用了颜色特征和纹理特征,分别对颜色图像分类、纹理图像分类以及综合特征图像分类进行了比较,并在 Pc 机上进行大量实验,对实验数据进行对比和分析。1.3 开发技术介绍 1.3.1 SVM 技术及其发展简史 SVM是支持向量机(SupportVector Machine)简称,是在统计学习理论基础上发展起来一种机器学习方法。早在六十年代,SVM奠基人 V.Vapink 就开始
18、了统计学习理论研究。1971 年,V.Vapink 和 Chervonenkis在“The Necessary and Sufficient Conditions for the Unifoms Convergence of Averages to Expected values,一文中,提出了 SVM一个重要理论基础-VC维理论。信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实
19、验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务2/36 1982 年,在“Estimation of Dependences Based on Empirical Data”一书中,V.Vapnik 进一步提出了具有划时代意义结构风险最小化原理,为 SVM奠定了直接、坚实理论基础。1992 年,B.Bos
20、er,T.Guyon和 V.Vapnik,在“A Training Algorithm for Optimal Margin C1assifiers”一书中,提出了最优边界分类器,由此形成了SVM 雏形。SVM提出被认为是机器学习一个重要革新。1993 年,Cortes 和 Vapnik,在“The Soft Margin classifier”一文中,进一步探讨了非线性最优边界分类问题。1995 年,Vapnik 在“The Nature of statistical Learning Theory”一书中,完整地提出了 SVM分类。1997 年,V.Vapnik,S Gokowich 和
21、A Smola,发表“Support Vector Method for Function Approximation,Regression Estimation,and signal Processing”,一文中,详细介绍了基于 SVM方法回归算法和信号处理方法。1998 年,Smola 在他博士论文中详细研究了 SVM中各种核机理和应用,为进一步完善 SVM非线性算法做出了重要贡献。l999 年,B Schokopf 和 S Mika 等人在“Input SpaceVersus Feature Space in Kemel-Based Methods”一文中提出了将核变换和核技巧用于空间
22、变换。同年,Bscholkopf,C.J.C.Burges和 AJSmola 在“Advances in Kemel Methodssupport Vector Learning”一文中详细阐述了核方法。上述及同期其它学者工作,将隐含在 SVM中核方法引申出来,并且得以发展和完善。核方法提出、完善和进一步地应用,是 SVM对学习算法重要贡献,是 SVM发展一个重要里程碑。1.3.2 java技术简介 Java是一种可以撰写跨平台应用软件面向对象程序设计语言,是由 Sun Microsystems公司于1995年5月推出Java 程序设计语言和Java 平台(即JavaEE,JavaME,Jav
23、aSE)总称。Java 自面世后就非常流行,发展迅速,对 C+语言形成了有力冲击。Java 技术具有卓越通用性、高效性、平台移植性和安全性,广泛应用于个人 PC、数据中心、游戏控制台、科学超级计算机、移动电话和互联网,同时拥有全球最大开发者专业社群。在全球云计算和移动互联网产业环境下,Java 更具备了显著优势和广阔前景。Java 是由 Sun Microsystems公司于 1995 年 5 月推出 Java 面向对象程序设计语言(以下简称 Java 语言)和 Java 平台总称。由 James Gosling 和同事们共同研发,并在 1995 年正式推出。Java 最初被称为 Oak,是
24、1991 年为消费类电子产品嵌入式芯片而设计。1995 年更名为 Java,并重新设计用于开发 Internet应用程序。用 Java 实现 HotJava 浏览器(支持 Java applet)显示了 Java 魅力:跨平台、动态 Web、Internet计算。从此,Java 被广泛接受并推动了 Web迅速发展,常用浏览器均支持 Javaapplet。另一方面,Java 技术也不断更新。(2010年 Oracle 公司收购了 SUN)信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面
25、尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务3/36 第二章 系统分析 2.1 系统需求分析 随着信息社会到来,人们越来越多接触到大量图像信息。每天都有大量图像信息在不断产生(如卫星、地质、医疗、安
26、全等领域),这些图像信息有效组织和快速准确分类便成了人们亟待解决课题。图像分类就是利用计算机对图像进行定量分析,把图像中每个像元或区域划归为若干类别中一种,以代替人视觉判读,图像分类过程就是模式识别过程,是目视判读延续和发展。是工业和学术界热点问题。SVM,Support Vector Machine,即支持向量机,是一种机器学习算法,不过现今最常拿来就是做分类(classification)。也就是说,如果我有一堆已经分好类东西(可是分类依据是未知!),那当收到新东西时,SVM 可以预测(predict)新数据要分到哪一堆去。2.2 系统业务流程分析 应用 svm 分类步骤如下:(1)首先搜
27、集各个类训练集和测试集(2)从训练集和测试集中提取图片特征(3)将训练集提取数据用于 svm学习训练,得到训练模板(4)通过模板对测试集提取特征数据用于分类,得到分类结果 系统业务流程图如下图 2.2 所示:图 2.2 系统业务流程图 搜集训练图片 特征提取 搜集测试图片 学习 分类器 分类 分类结果 信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机
28、概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务4/36 第三章 系统总体设计 3.1 分类系统结构 基于支持向量机图像分类实验系统框架示意图如下图 3.1 所示:图 3.1 系统结构图 3.2 图像数据库 图像数据库指搜集不同种类图片作为特征提取图片数据集。本次我所取图片以颜色特征为主如下表格 3.2 所示:表格 3.2 图片类别 红
29、色 黑色 蓝色 绿色 黄色 3.3 特征提取模块 该模块主要负责对图像数据库中图像进行特征提取,并对其进行特征归一化处理,把所提取特征数据以下格式写到特征输出文件中,以作为下一个模块输入数据。label index1:value1 index2:value2.label index1:value1 index2:value2.3.4 svm 分类模块 该模块以特征提取模块输出文件作为输入,可以对支持向量机各个参数进行选择,包括核函数及其参数,然后用一定量样本对该学习机进行学习和训练,用测试样本来测试,得到最后分类效果。使用 SVM 流程大概就是:1.准备数据并做成指定 格式(有必要时需 svm
30、scale)。图像 图像特征提取模块 SVM 分类模块 信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术
31、介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务5/36 2.用 svmtrain 来 train 成 model。3.对新输入,使用 svmpredict 来 predict 新数据,得到分类结果。信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对
32、分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务6/36 第四章 系统详细设计 4.1 特征提取模块 该模块主要负责对图像数据库中图像进行特征提取,并对其进行特征归一化处理,然后把图像特征值输出到相应文件中,以作为下一个模块输入。4.1.1 颜色矩 颜色是彩色图像最重要内容之一,被广泛用于图像检索中。但从图像中提取颜色特征时,很多算法都先要对图像进行量化处理。量化处理容易导致误检,并且产生图像特征维数较高,不利于检索。str
33、icker和 0reng0 提出了颜色矩方法1,颜色矩是一种简单有效颜色特征表示方法,有一阶矩(均值,mean)、二阶矩(方差,viarance)和三阶矩(斜度,skewness)等,由于颜色信息主要分布于低阶矩中,所以用一阶矩,二阶矩和三阶矩足以表达图像颜色分布,颜色矩已证明可有效地表示图像中颜色分布,该方法优点在于:不需要颜色空间量化,特征向量维数低;但实验发现该方法检索效率比较低,因而在实际应用中往往用来过滤图像以缩小检索范围。设 p(i,j)图像像素值,N为像素数,则:Mean=(sum(p(I,j)/N Variance=sqrt(sum(p(I,j)-mean)2/N)Skewne
34、ss=Variance=(sum(p(I,j)-mean)3/N)1/3 三个颜色矩数学定义:其中,Pi,j表示图像第 i 个颜色通道分两种灰度为 j 像素出现概率,N表示图像中像素个数。及颜色直方图相比,该方法另一个好处在于无需对特征进行向量化。因此,图像颜色矩一共只需要 9 个分量(3 个颜色分量,每个分量上 3 个低阶矩),及其他颜色特征相比是非常简洁。在实际应用中为避免低次矩较弱分辨能力,颜色信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应
35、用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务7/36 矩常和其它特征结合使用,而且一般在使用其它特征前起到过滤缩小范围(narrow down)作用。4.2 SVM分类模块 该模块以特征提取模块输出文件作为输入,可以对支持向量机各个参
36、数进行选择,包括核函数及其参数,然后用一定量样本对该学习机进行学习和训练,用测试样本来测试,得到最后分类效果。4.2.1 svm 算法简介 近年来,随着统计学习理论和支持向量机越来越受到广泛关注,陆续提出了许多关于 SVM训练算法,其算法也日益完善。下面就简单介绍一下 SVM算法。SVM训练算法主要有三类:二次规划算法,分解算法和增量算法。另外,针对特定问题,很多研究者在这三类算法基础上提出了很多改进算法,这些算法在特定问题解决中表现出了很好效果。第一类是二次规划算法。在前面分析中多次提到,SVM可以归结为一个二次规划(QP)问题,QP 是一种常见优化问题,有一套比较成熟理论基础。从数学角度分
37、析,SVM 是一个求条件极值问题,其通常解法有罚函数法和单纯形法。罚函数法基本思想是将解不满足约束条件程度作为惩罚项加在目标函数中,将条件极值问题转化为无条件极值问题来处理,求得其解后增大惩罚力度,将上一步结果作为下一次寻优起始迭代点,再求解无条件极值问题,直到满足约束为止。单纯形法是先随机找到一个可行点作为初值点,构造以可行点为顶点单纯形,然后按某种搜索策略逐步缩小单纯形,直至各项点间距离在允许误差范围内为止。第二类是分解算法。当训练样本增加时,二次规划算法存在训练速度慢,效率低下,算法复杂而难以实现等问题。为此,一些学者提出了处理大规模训练集算法。Cones 和 Vapnik 提出 Chu
38、nking 算法,该算法每次求解一个子 QP问题,得到若干支持向量。用这些支持向量和一些不满足优化条件样本,构成新子 QP问题,而初始子问题由任意若干个样本构成。重复上述过程,知道所有样本满足优化条件。该方法存在问题是,当支持向量较多时,算法训练速度明显变慢。因为该方法实际求解 QP问题中赫赛(Hessiall)矩阵规模下降为最多。P1att 提出了 SMO(Sequential Minimal和 mization序贯最小优化)算法。该算法将工作样本集规模减到最小一一两个样本情况,其优点是针对两个样本二次规划问题可以有解析解形式,从而避免了多样本情况下数值解不稳定及耗时问题,同时也不需要大矩阵
39、存储空间,特别适合稀疏样本,算法避开了复杂数值求解优化问题过程。此外,SVM算法工作集选择也别具特色,不是传统最陡下降法,而是采用启发式策略,通过两个嵌套循环来寻找待优化样本变量。在外循环中寻找违背KKT(KarushKuhnTuckcr)最优条件样本,然后在内循环中再选择另一个样本,信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做
40、了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务8/36 完成一次优化。再循环,进行下一次优化,直到全部样本都满足最优条件,这大大加快了算法收敛速度。sM0算法主要耗时在最优条件判断上,所以应寻求最合理即计算代价最低最优条件判别式。第三类是增量算法。训练方式是在训练样本单个输入情况下训练,其训练样本总个数是未知。最典型应用是系统在线辨识。Ahmed sN
41、最早提出了 SVM增量训练算法,但只是近似增量,即每次只选一小批常规二次规划算法能处理训练样本,然后只保留支持向量,抛弃非支持向量,和新进来样本混和进行训练,知道训练样本用完为止,实验表明误差可以接受。Cauwenberghs G等人提出了增量训练精确解,即增加一个训练样本或减少一个样本对 Lagrange 系数和支持向量影响,实验表明算法是有效,特别是减少一个样本时,对模型选择算法LOO(Leave one out)形象解释,缺点是当样本无限增多时,还是必须抛弃一些样本,使其能够实用。此外,在以上三类基本算法基础上,许多学者还提出了其他算法,如;张学工提出 CSVM算法,将每类训练样本集进行
42、聚类分成若干个子集,用子集中心组成新训练样本集训练 SVM等。这些算法为 SVM广泛应用起到了推动作用。4.2.2 svm 核函数选择 支持向量机模型最重要一个参数就是核函数。选择什么样核函数,就意味着将训练样本映射到什么样空间去进行线性划分,核函数选择关系到能否得到正确识别结果,而怎样从理论上保证选择最优核函数仍是一个有待解决问题,目前多是通过实验来决定。4.2.3 svm 核函数 核函数是 SVM 模型建立一个主要问题,因为核函数在支持向量机中占有比较重要地位,所以本节将其单独列出来,对现有研究成果进行整理和分析,为以后实验打下坚实理论基础。Vapnik 在 SVM理论中提到,当问题不是线
43、性可分时,利用核函数将样本集映射到某一高维空间,使得样本集在高维空间像集是线性可分。定理:对任给样本集 K,均存在一映射墨 K1,K2两类,则必然存在一映射 F:SnM,F(K)在 M中是线性可分。该定理说明:对任给样本集 K,均存在一映射 F,在此映射下,F(K)(在高维空间中)是线性可分。上述即为核函数存在性定理,该定理为在任意样本集上应用核方法(包括SVM)提供了理论保证。4.2.4 svmtrain用法 svmtrain实现对训练数据集训练,获得 SVM模型。Train(训练)data.train 会接受特定格式输入,产生一个 Model 文件。这个 model 你可以想象成 SVM
44、内部数据,因为 predict 要 model 才能 predict,不能直接吃信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究
45、意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务9/36 原始数据。用法:svmtrain options training_set_file model_file;其中,options(操作参数):可用选项即表示涵义如下所示:-s svm 类型:设置 SVM 类型,默认值为 0,可选类型有:0-C-SVC 1-n-SVC 2-one-class-SVM 3-e-SVR 4-n-SVR-t 核函数类型:设置核函数类型,默认值为 2,可选类型有:0-线性核:u*v 1-多项式核:(g*u*v+coef 0)deg ree 2-RBF 核:e(u v 2)g-
46、3-sigmoid 核:tanh(g*u*v+coef 0)-d degree:核函数中 degree 设置,默认值为 3;-g g:设置核函数中 g,默认值为 1/k;-r coef 0:设置核函数中 coef 0,默认值为 0;-c cost:设置 C-SVC、e-SVR、n-SVR 中从惩罚系数 C,默认值为 1;-n n:设置 n-SVC、one-class-SVM 及 n-SVR 中参数 n,默认值 0.5;-p e:设置 n-SVR 损失函数中 e,默认值为 0.1;-m cachesize:设置 cache 内存大小,以 MB为单位,默认值为 40;-e e:设置终止准则中可容忍
47、偏差,默认值为 0.001;-h shrinking:是否使用启发式,可选值为 0 或 1,默认值为 1;-b 概率估计:是否计算 SVC或 SVR概率估计,可选值 0 或 1,默认 0;-wi weight:对各类样本惩罚系数 C加权,默认值为 1;-v n:n 折交叉验证模式。其中-g 选项中 k 是指输入数据中属性数。操作参数-v 随机地将数据剖分为 n 部分并计算交叉检验准确度和均方根误差。以上这些参数设置可以按照 SVM 类型和核函数所支持参数进行任意组合,如果设置参数在函数或 SVM 类型中没有也不会产生影响,程序不会接受该参数;如果应有参数设置不正确,参数将采用默认值。train
48、ing_set_file是要进行训练数据集;model_file是训练结束后产生模型文件,该参数如果不设置将采用默认文件名,也可以设置成自己惯用文件名。4.2.5 svmpredict用法 svmpredict 是根据训练获得模型,对数据集合进行预测,依照已经 train 好 model,再加上给定输入(新值),输出 predict(预测)新值所对应类别。用法:svmpredict options test_ output_file;options(操作参数):-b probability_estimates:是否需要进行概率估计预测,可选值为 0 或者 1,信学院答辩日期摘要支持向量机方法是
49、建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分类也做了详说明最方法比采用单一特征方法进行分类得到结果要更令人满意关键词支持向量机图像分类特征提取颜色矩目录摘要第一章前言本课题研究意义本论文目内容开发技术介绍技术及其发展简史技术简介第二章系统分析系统需求分析系统业务10/36 默认值为 0。m
50、odel_file 是由 svmtrain 产生模型文件;test_file 是要进行预测数据文件;output_file 是 svmpredict 输出文件,表示预测结果值。svmpredict 没有其它选项。信学院答辩日期摘要支持向量机方法是建立在统计学习理论基础之上克服了神经网络分类和传统统计分类方法许多缺点具有较高泛化性能但是由于支持向量机尚处在发展阶段很多方面尚不完善现有成果多局限于理论分析而应用显得作用本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统文中首先引入了支持向量机概念对支持向量机做了较全面介绍然后讨论了图像特征描述和提取方法对图像颜色矩特征做了详描述对分